-
Notifications
You must be signed in to change notification settings - Fork 1.6k
Closed
Description
首先需要肯定 ChatGLM3-6B 的 Function call 和 Interpreter 都非常新颖,填补了开源模型的一些空白。
但经过一段时间的试用,我发现当前模型有以下问题,这种问题是模型层次的,只能通过训练解决,希望在下个版本能够考虑。
- Function 的参数不能是字典或JSON,而只能是Python Primitive
- 工具,或者说function的名称不能为 interpreter
- 处理 markdown 前缀和
tool_call()调用形式过于复杂
如果进行一些分析思考,不难推测,Function call 功能是建立在 Interpreter 基础上微调得到的,本质上还是 Python Interpreter
https://replicate.com/p/qudth7dbwpljdbgmw5p2glk2qq
这一点尤其限制了模型理解和生成JSON树状结构的能力。
同时当前模型的输出形式,可以推测只是为了在Python中实现起来方便。
我想说的是eval任意Python代码的实现方式是非常危险的, 在工程上也是不可接受的。
所以Function call的能力不应该建立在Interpreter基础上, 最好也不要和Python扯上任何关系,做成语言中立的。
建议对模型进行JSON树状结构的微调,这一点才是应用开发者最期盼的。
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels