作者创建一个基于智谱清言平台和GLM4模型的表情包智能体的整个过程。文章详细描述了从创意思考到实际执行的每个步骤,包括表情包数据的爬取、预处理和批量上传,以及智能体的创建和训练。
作者首先探求如何让语言模型(LLM)更具人性化和拟人特征,提出了一个解决方法——整合表情包作为人类交流的模因。然后借助多模态大模型进行视觉推理,对表情包图像进行数据标注,并将这些数据用作检索增强,使智能体能够理解和匹配到用户输入的表情包。
整个项目的挑战包括处理不支持动态图像的格式问题和确保图床的有效性。最终,作者创建了一个可以根据用户的聊天内容自动回复最匹配表情包URL的智能体,通过Markdown格式进行输出。
文章还提到了智能体API的开发,这允许将智能体应用到更多场景,例如微信群聊和工作流工具中,扩展了其使用范围。
作者的这一创举不仅体现了创新思维,而且为LLM在实际应用中的拟人化和互动性提供了可行的解决方案。这个智能体能够在社交交流中增添乐趣元素,增强数字沟通的表现力。