国产 AI 机器人好超前…弹琴泡茶打咏春，还能撸猫？？

国产 AI 机器人好超前…弹琴泡茶打咏春，还能撸猫？？｜AGI 掘金资讯
2024-8-20 13:59:19 Author: mp.weixin.qq.com(查看原文) 阅读量:1 收藏

酱酱们中午好～今天的 AGI 掘金热点资讯来啦，我们知识库上线了 AI 小助手，欢迎来撩！（https://sourl.co/G5Gpqh）

🌟 技术突破

🔗 国产 AI 机器人好超前…弹琴泡茶打咏春，还能撸猫？？

Astribot S1 是由星尘智能开发的先进人形机器人，能独立完成弹琴、泡茶、烹饪、武术等复杂任务，展现其强大的学习和执行能力。机器人采用人形上半身和轮式底盘设计，具有高度仿人的身体指标和精细的操作能力。通过模块化设计，S1 能灵活适应不同需求。其 AI 算法和刚柔耦合传动机构设计，使其在复杂环境中具备出色的感知、认知和实时决策能力，同时确保操作安全。星尘智能致力于让更多人拥有 AI 机器人助理，推动"AI+机器人"技术革新。

🔗 4 秒看完 2 小时电影！阿里发布通用多模态大模型 mPLUG-Owl3

阿里巴巴集团的 mPLUG 团队推出了 mPLUG-Owl3，一款通用多模态大模型，能在 4 秒内处理 2 小时电影内容。该模型在图像处理和视频理解方面表现出色，具备高效的推理效率和准确性，无需牺牲性能。mPLUG-Owl3 通过 Hyper Attention 模块，实现了视觉与文本的深度融合，优化了模型的多模态能力。在多个 Benchmarks 上取得 SOTA 成绩，展示了其在单图、多图和长视频理解方面的先进性。模型的开源代码和 demo 提供了进一步研究和应用的可能性。

🔗 科大讯飞推出“星火极速超拟人交互”：可模仿孙悟空、蜡笔小新等音色、语气、人设

科大讯飞发布星火语音大模型的升级版，具备极速响应、情绪感知、灵活表达和多人设切换四大特性。新模型实现语音到语音的端到端建模，提升响应速度和流畅度，能识别并共鸣多种情绪，支持情感、风格和方言的个性化控制。用户可与孙悟空、蜡笔小新等角色进行互动。该技术计划于 8 月 30 日在讯飞星火 APP 上线，供全民体验。

🔗 “一人一剧”时代来临：AI 短剧平台 SkyReels 正式发布

昆仑万维集团发布全球首个 AI 短剧平台 SkyReels，集成剧本生成、角色定制、分镜、剧情、对白/BGM 及影片合成等全流程创作工具。SkyReels 利用自研技术和 AI 模型，实现一键生成高质量视频，大幅提高创作效率，降低成本，推动个性化内容创作。平台支持 1080P 60 帧高清视频输出，满足专业和非专业用户需求，预示着 AI 驱动的短剧创作与消费新时代的到来。

🔗 LLM 数学性能暴涨 168%，微软 14 人团队力作！合成数据 2.0 秘诀曝光

微软团队开发了 AgentInstruct 智能体框架，通过自动生成多样化的合成数据，显著提升了大型语言模型（LLM）的性能。Orca-3 模型在后训练后，在多个基准测试中表现卓越，数学能力提升高达 168%。AgentInstruct 利用生成式教学方法，通过强大的模型如 GPT-4 结合工具，创建了 2500 万对数据，覆盖文本编辑、创意写作等技能，有效提升了模型的阅读理解和数学问题解决能力，减少了模型幻觉，达到了与 GPT-4 相当的质量水平。

🔗 Half_illustration：基于 Flux.1 的 LoRA 模型，照片秒变艺术大片

Half_illustration 是一款基于 Flux.1 LoRA 模型的 AI 工具，能够将普通照片通过用户描述的场景和元素，如烟雾、花朵、火焰等，转化为具有视觉冲击力的艺术作品。用户只需添加特定风格提示词"in the style of TOK"，即可获得风格化的作品。该工具不仅适用于艺术创作，还能在时尚摄影、广告设计等领域发挥作用，并提供 API 接口和与 Diffusers 库的兼容性，方便开发者使用。

🔗 智源千万级指令微调数据集 Infinity-Instruct 持续迭代，Llama3.1 仅微调可接近 GPT-4

智源研究院推出千万级指令微调数据集 Infinity-Instruct，包含数学、代码、常识问答等领域数据，通过迭代更新，显著提升了 Llama3.1 等模型的综合能力。Infinity-Instruct-7M 和 Gen 版本分别强化了模型的基础能力和对话鲁棒性，使得微调后的模型在多个评测榜单上超越官方对话模型，接近 GPT-4 的对话能力。该数据集在 Hugging Face 等平台发布，支持开源微调工作，智源计划未来开源数据处理和模型训练代码，进一步推动 AI 对话技术发展。

🔗 faiss 向量数据库测试《三体》全集，这家国产 AI 加速卡，把性能提了 7 倍！

海光 DCU（Data Center Unit）作为国产 AI 加速卡，在向量数据库 Faiss 的搜索性能测试中表现出色。Faiss 是 Facebook AI Research 开发的用于大规模向量相似性搜索和聚类的开源库。测试选用《三体》全集文本数据，在 CPU 和 GPU 环境下对比搜索效率，结果显示使用海光 DCU 的 GPU 搜索性能比 CPU 提高了约 7 倍。测试环境基于 Ubuntu 22.04.1 LTS，通过 Embedding 模型将文本转换为向量数据，再利用 Faiss 进行搜索。随着数据量的增加，DCU 的加速效果将更加显著。

💫 企业动态

🔗 阿里通义千问启用新域名“tongyi.ai”，网页版聊天功能升级

阿里大语言模型“通义千问”宣布启用新域名“tongyi.ai”，并引入多项新特性。网页版聊天新增深度搜索功能，提供更专业和结构化的搜索结果，同时数字角标悬浮显示来源网页。App 端新增图片微动效支持多尺寸图片，并调整自定义唱演功能，支持 3:4 画幅并延长音频时长至 300 秒。此外，阿里云万网推出 AI 化域名产品服务，实现智能起名功能，用户可基于通义大模型一键生成创意域名。

🔗 麦当劳请了 11 个 AI 美女为薯条疯狂打 call：引发千万围观

麦当劳日本推出由 AI 艺术家 Kaku Drop 制作的薯条广告，11 位 AI 美女以不同风格展示产品，引发千万级观看和网友热议。广告中，AI 少女们以未来感和写实风格出现，展示麦当劳薯条。最后一名少女实际品尝薯条，视频质量获得网友称赞。同时，广告成本低于真人代言，但存在版权和道德争议。Luma AI 工作室透露 Dream Machine 新版本 1.5 即将发布，展示新模型生成的作品。

🔗 特斯拉招募机器人“老师”：每小时 48 美元，高薪重体力活

特斯拉以高薪招募“数据采集操作员”，通过动作捕捉服训练 Optimus 机器人，旨在让其胜任从工厂到家庭的多种工作。这一“人肉训练”方式引发业界争议，支持者认为它类似于自动驾驶汽车的训练，通过海量数据训练人工智能，而反对者则质疑仅凭动作数据难以让机器人真正理解人类行为。Optimus 的未来充满不确定性，技术成熟度、成本控制和伦理问题都是需要深入探讨的挑战。

🔗 人形机器人加入新玩家？消息称地平线公司组建约 50 人具身智能团队

自动驾驶计算方案公司地平线集团组建了一支约 50 人的具身智能团队，由副总裁余轶南领导。余轶南是地平线创始团队成员之一，曾任百度深度学习研究院科学家。新团队将专注于具身智能软硬件的研发，面向未来。地平线集团的长远使命是机器人，智能汽车被视为机器人的一个分支。公司通过智能汽车推动相关技术发展，如激光雷达成本的大幅降低，为机器人领域的发展打下基础。具身智能和人形机器人是科技领域的热点，地平线集团的这一举措显示了其在该领域的雄心和对未来的布局。

🔗 Consensus CEO 回怼奥特曼“碾压”初创言论：从“套壳”开始也能做出伟大产品

在 AI 领域，初创公司常被质疑为"套壳"应用，依赖大公司技术。奥特曼曾表示，OpenAI 等巨头会"碾压"这些公司。但 Consensus CEO Eric Olson 反驳，认为初创公司通过提供差异化服务和细节关注，也能成功。他指出，即使是科技巨头，起初也可能只是"套壳"，关键在于能否围绕核心功能不断增加附加价值，打造卓越产品。Olson 强调，专业化至关重要，初创公司可在巨头忽视的细分市场找到机会。他鼓励创业者不要害怕巨头的竞争，而应专注于打磨产品，解决用户问题。

🔗 谷歌或将停产 Fitbit 智能手表，专注 Pixel Watch 系列

据 TechRadar 报道，谷歌已确认不再生产 Fitbit Sense 和 Versa 系列智能手表，转而专注于健身追踪器和 Pixel Watch 系列。Pixel Watch 3 集成了谷歌软件和 Fitbit 健身追踪功能，标志着 Fitbit 智能手表时代的可能结束。尽管谷歌表示将继续推出 Fitbit 新产品，但未明确否认停产消息。Fitbit 手表功能逐渐被 Pixel Watch 所取代，但健身追踪技术和经验将延续。

🔗 AI+Marketplaces：Agent 如何模糊货架电商与兴趣电商的界限？

TargetPilot，一家国内出海项目，通过 AI 技术提升跨境独立站的购物体验。创始人 Vincent 及其团队利用 AI 搜索和推荐算法，为消费者提供个性化购物体验，同时为商家提供独立站托管服务。商业模式涵盖电商 AGI 推荐、SaaS 服务和 API 输出。TargetPilot 已获得微软和英伟达支持，并在 Shopify 等平台上架，MRR 达数万美元，致力于通过 AI 模糊货架电商与兴趣电商的界限。

✨ 行业观点

🔗 AI 泡沫恐慌：技术革新与市场调整

2024 年全球股市经历重挫，科技股领跌引发 AI 泡沫恐慌。市场对 AI 技术未来发展过于乐观，导致投资过剩。然而，与互联网泡沫相比，当前 AI 泡沫有限，且有实际价值支撑。AI 技术被视为下个时代的基建，投资回报周期长，但潜在经济效益巨大。尽管存在成本和应用挑战，AI 的效能提升和成本下降趋势明显，预示着其在经济生态中的重要作用。

🔗 调查显示过半《财富》世界 500 强企业将 AI 视为“风险因素”

最新调查显示，56%的《财富》世界 500 强企业将人工智能视为潜在风险因素，与 2022 年的 9%相比显著上升。尽管有 33 家公司认为 AI 能带来成本效率和创新，但多数企业担心无法跟上技术发展，面临竞争加剧风险。特别是在媒体、娱乐、电信、医疗和金融服务等行业，企业担心 AI 可能带来数据偏见或监管问题，影响收益和声誉。

🔗 ChatGPT 成 8 岁娃「导师」，外国家长们慌了！

全球多地学校开始推行 AI 辅助教学，如伦敦 David Game College 利用 ChatGPT 备考，加州可汗实验室学校引入 Khanmigo。韩国计划全国推广 AI 驱动教科书，旨在实现个性化教学，提高教育效率。然而，家长和部分教育者担忧 AI 可能带来的负面影响，如过度依赖数字设备、错误信息传播和削弱学生批判性思维能力。教育改革需平衡 AI 技术应用与学生全面发展。

🔗 邬贺铨院士：AI 大模型仍需“大力出奇迹”

中国工程院院士邬贺铨在 2024 北京人工智能生态大会上提出，人工智能作为新质生产力引擎，其大模型发展需通过巨大努力实现突破。他指出，算力、数据是 AI 发展的关键，当前中国算力枢纽利用率有提升空间，数据供给和应用潜力释放不足，需加快数据基础制度建设。邬院士认为，大模型性能与模型参数量、数据集大小、算力规模呈幂律关系，需多措并举提升对物理世界的模拟能力。他建议政府和企业营造 AI 生态，推动行业应用和模式创新。中小企业面临人才、技术、数据短缺，大模型落地需优化模型结构和训练策略。

🎡 热门活动

🔗 AI Talk 沙龙第3期-深圳站｜2024.8.24 （周六）14:00-17:00

（https://agijuejin.feishu.cn/wiki/TejhwuzeuiMu67ksQKjcW0l5nNg）

❝
AGI 掘金成立于 2024 年7 月，是一家专注于 AGI 相关研究和应用的创新型知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展，并将其应用于各个行业，为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务，致力于成为行业的领军者。AGI 掘金期待你的加入！
欢迎戳我加入 AGI 掘金飞书社群交流学习😊（https://sourl.co/G5Gpqh）
❞

文章来源: https://mp.weixin.qq.com/s?__biz=MzI1MzYzMjE0MQ==&mid=2247508962&idx=2&sn=2f5176573a57bcf1e5a06fab9fc92a4d&chksm=e9d36800dea4e116b82642444a342b23215dc1c07cd0255272fc0e54436d45667c560265bf99&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh