1 
                    
                    matrix1010      2024-04-22 15:12:31 +08:00 via iPhone 
                    
                    数组拆开一个个发不就行了 
                 | 
            
     2 
                    
                    renmu      2024-04-22 15:32:44 +08:00 via Android 
                    
                    function call 调用一下 
                 | 
            
     3 
                    
                    LuffyPro   OP  | 
            
     4 
                    
                    Trinityuan      2024-04-22 15:40:07 +08:00 
                    
                    @matrix1010 赞同,这样还可以并行请求,顺便优化了底下提到的延迟问题。 
                 | 
            
     5 
                    
                    vacuitym      2024-04-22 15:44:43 +08:00 
                    
                    可以试试优化一下 prompt ,比如给他一个示例,强调一下对应关系,然后让他 json 格式返回之类的 
                 | 
            
     6 
                    
                    LuffyPro   OP 谢谢大家的回复! 
                @renmu 谢谢建议,回头我试一下。 @Trinityuan 嗯嗯,你的补充是我现有方案正在执行当中的优化版。 @vacuitym 提示语里面确实没提供实例,返回格式这点是有规范要求的,我尝试过,数量不等时,带上上下文,同时强化提示语,结果返回还是数组长度不一致的结果。  | 
            
     7 
                    
                    matrix1010      2024-04-22 18:53:01 +08:00 
                    
                    @LuffyPro 可以试试这个 https://community.openai.com/t/returning-fixed-length-arrays-with-chat-completion-api/329001/3, 我用 gemini 1.0 试了几次。数组长度为 20 挺稳定,偶尔会少,没有多过。但一一对应没问题。我猜 gemini 内部应该是根据 schema 一个一个字段按顺序填充的,类似于发多次请求 
                 | 
            
     8 
                    
                    yinmin      2024-04-23 07:40:44 +08:00 via iPhone 
                    
                    数组改成 json 格式,调用 api 的数据包里再加一组问答的示例 
                 | 
            
     9 
                    
                    maymay5      2024-04-23 11:54:37 +08:00 
                    
                    jsonmodel 
                 | 
            
     10 
                    
                    LuffyPro   OP  | 
            
     11 
                    
                    leoWeek      2024-04-24 16:38:30 +08:00 
                    
                    也是存在同样的问题,长文本给 gpt 后,输出都是总结或者删减内容,并没有按原文逐句翻译,最后只能拆成每 300 个字符一段去处理了 
                 |