飞书集成 3 大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能
2023-3-22 16:28:18 Author: www.appinn.com(查看原文) 阅读量:47 收藏

Home

AI

飞书集成 3 大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能

最近青小蛙又发现了一个新的有趣的项目:Leizhenpeng/feishu-chatgpt,它能够将 GPT-3.5、DALL·E、Whisper 接入飞书,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能。@Appinn

飞书集成3大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能

其实这个项目叫 feishu-openai 可能更贴切一些 😂

原理是通过飞书的企业自建应用,建立一个机器人,然后机器人通过 Webhook 与项目交互,从而引入了 OpenAI 的三大项目。

功能

  • 🗣 语音交流:私人直接与机器人畅所欲言
  • 💬 多话题对话:支持私人和群聊多话题讨论,高效连贯
  • 🖼 文本成图:支持文本成图和以图搜图
  • 🎭 角色扮演:支持场景模式,增添讨论乐趣和创意
  • 🔄 上下文保留:回复对话框即可继续同一话题讨论
  • ⏰ 自动结束:超时自动结束对话,支持清除讨论历史
  • 📝 富文本卡片:支持富文本卡片回复,信息更丰富多彩
  • 👍 交互式反馈:即时获取机器人处理结果

开发中的功能

  • 🏞 场景预设:内置丰富场景预设,方便用户管理场景 🚧
  • 🔙 历史回档:轻松回档历史对话,继续话题讨论 🚧
  • 🔒 管理员模式:内置管理员模式,使用更安全可靠 🚧
  • 🌐 多token负载均衡:优化生产级别的高频调用场景
  • ↩️ 支持反向代理:为不同地区的用户提供更快、更稳定的访问体验
  • 📚 与飞书文档互动:成为企业员工的超级助手 🚧
  • 🎥 话题内容秒转PPT:让你的汇报从此变得更加简单 🚧
  • 📊 表格分析:轻松导入飞书表格,提升数据分析效率 🚧
飞书集成 3 大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能 1
飞书集成 3 大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能 2

部署

支持 Serverless 云函数、本地环境、Docker、二进制安装包多种渠道部署,具体见 GitHub 页面,非常详细:

另外也提供了飞书机器人的创建教程。对于开发者来说,相当于保姆级了。

原文:https://www.appinn.com/feishu-openai/


GPT-3.5、DALL·E、Whisper 分别是什么

这三者均为 OpenAI 的产品:

GPT-3.5 是由 OpenAI 在 2022年6月发布的人工智能文本生成模型,是GPT-3的升级版。它比GPT-3更强大,能够生成更高质量的文章、翻译、自然语言处理等。GPT-3.5是由OpenAI开发的,采用了更高级的机器学习技术,具有更高的语言理解能力和更强的创造力。

DALL·E 是 由 OpenAI 在2021年发布的图像生成AI模型。该模型能够将自然语言描述转换为相关的图像。例如,当用户输入“火车站前的猫”时,DALL·E 可以生成一张火车站前的有一只猫的图像。DALL·E的技术依赖于深度学习和生成对抗网络 (GANs) 技术。

Whisper 是由 OpenAI 在 2022 年推出的一项新技术,它是一种语音合成技术,可以生成非常逼真的人声。Whisper 能够生成在多种语音干扰条件下清晰的语音,还可以实时响应并自动调整语音内容以适应不同的应用场景。该技术还具备个性化合成功能,可以根据特定讲话人的单词、语音、口音等信息,生成逼真的语音。Whisper 技术应用于语音识别、智能客服、教育交互等多个领域,为语音应用提供更加逼真的人机交互体验。


文章来源: https://www.appinn.com/feishu-openai/
如有侵权请联系:admin#unsafe.sh