笑死!马斯克成 Grok2 最大受害者,恶搞图满天飞|AGI 掘金资讯
2024-8-16 15:10:25 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩!(https://sourl.co/G5Gpqh)

🌟 技术突破

🔗 笑死!马斯克成 Grok2 最大受害者,恶搞图满天飞

Grok 2.0 AI 模型上线引发网络恶搞热潮,马斯克成为焦点。用户通过模型生成了各种荒诞不经的马斯克形象,包括与名人互动的虚构场景。Grok 2.0 的逼真 AI 生图功能由 Flux.1 提供支持,与 Stable Diffusion 同源。模型虽设安全限制,但版权和敏感内容问题仍存。科技媒体和网友对 Grok 未来表示担忧,同时对其性价比和会员功能表示认可。

🔗 OpenAI 推出 SWE-bench Verified,更精准评估 AI 的代码能力

OpenAI 推出了 SWE-bench Verified,这是对现有 SWE-bench 软件工程评估套件的改进。新版本通过人工验证解决了原始套件中的一些问题,如单元测试过于具体和问题描述不明确,提高了评估 AI 模型解决现实世界软件问题能力的可靠性。SWE-bench Verified 包含 500 个经人工筛选的样本,使用容器化 Docker 环境简化评估过程。改进后的评估显示,AI 模型性能显著提升,更准确地反映了模型的代码能力。

🔗 ACL 2024 大奖揭晓!全华人团队用 AI 破解 3000 年前甲骨文密码

在第 26 届国际计算语言学年会(ACL 2024)上,华中科技大学等机构的全华人团队凭借"Deciphering Oracle Bone Language with Diffusion Models"论文荣获最佳论文奖。该研究利用扩散模型,开发了"Oracle Bone Script Decipher"(OBSD)系统,为破译甲骨文提供了重要线索,并通过实验验证了其有效性,为 AI 辅助分析古代语言开辟了新途径。

🔗 国产版毒舌 AI 上线!雷军意外躺枪,体验后我破防了

一款国产毒舌 AI 上线,以其犀利的言辞在微博引发广泛关注。AI 不仅对微博大 V 进行疯狂 diss,连雷军也意外成为其调侃对象。该 AI 能够全面分析人的优点和缺点,甚至涉及情感和事业,其幽默且尖锐的评论让人破防。体验地址已提供,用户可亲自感受这款 AI 的独特魅力。

🔗 我国研发具备共情能力导诊大模型:有望用于术前谈话,减少医患冲突

中国医学科学院基础医学研究所团队研发的导诊大模型“特定场景提示增强对话机器人”通过临床试验,该模型结合真实医患对话构建,具备专业性和共情能力。在前瞻性随机对照试验中,该模型在事实性、安全性、共情能力上均优于人类,能降低重复沟通和医患冲突比例。研究成果已在《自然医学》发表,标志着 AI 在医疗领域的应用迈出重要一步。

🔗 北大张铭团队开发 ActFound 模型,160 万数据训练,加速癌症药物研发

北京大学计算机学院张铭教授团队与华盛顿大学等合作,开发了生物活性基础模型 ActFound。该模型利用 160 万数据训练,采用成对学习和元学习技术,有效解决了生物活性预测中的兼容性和泛化问题。ActFound 在多个生物活性评测基准数据集上表现出色,可作为自由能微扰计算工具的替代方案。实验显示,ActFound 在先导小分子优化和癌症药物反应预测方面具有显著优势,大幅提高预测效率,为药物研发带来新动力。

🔗 Llama 8B 通过搜索提升性能,超越 GPT-4o!新「Scaling Law」诞生?

最新研究表明,通过搜索技术,参数量仅 8B 的 Llama 3.1 模型在 Python 代码生成任务上实现了对 GPT-4o 性能的追赶甚至超越。这项发现基于强化学习先驱 Rich Sutton 的 Scaling Law 理念,强调了学习和搜索在 AI 发展中的重要性。实验通过 100 次搜索,Llama 3.1 在 HumanEval 基准测试中的 pass@k 分数显著提升,特别是在 k 为 1000 时,性能优于 GPT-4o。这表明,在推理阶段通过搜索方法增强,即使是较小的模型也能以可预测的方式胜过大型模型。搜索方法的强大之处在于其可随着计算量的增加进行透明扩展,有助于实现资源的进一步平衡。

🔗 成本降低 90%!Claude 上新 Gemini 同款提示词缓存,一次性记住整个代码库

Claude 新功能允许 API 一次性记忆整本书或代码库,显著降低处理长文本的延时和成本。该技术通过提示词缓存,减少重复输入,提高效率。谷歌 Gemini 和国内 Kimi、DeepSeek 团队已先行采用。缓存有效期限五分钟,但可重置。应用场景包括对话、代码助理、文档处理等,成本节约高达 90%。定价策略中,写入和读取价格独立,随缓存使用次数增加,成本优势更明显。此更新对开发者是重大利好,预示着大模型厂商可能的新标配。

🔗 清华唐杰团队新作:一口气生成 2 万字,大模型开卷长输出

清华大学唐杰团队和智谱 AI 的最新研究,成功提升了 GLM-4 和 Llama-3.1 模型的文本生成长度,从 1800 字增加至 7800 字,提升了四倍。研究团队通过分析限制因素、提出 AgentWrite 方法和扩展 LLM 输出窗口,解决了大模型在长文本生成上的难题。通过改变监督式微调阶段的数据集最大输出长度,引入 AgentWrite 的 pipline,以及使用 GPT-4o 生成的长输出 SFT 数据集 LongWriter-6k,显著提升了模型的输出能力。这项技术不仅提高了内容创作的全面性和创造性,还为未来模型输出长度和质量的进一步扩展打下了基础。

🔗 业界首个、开箱即用,华为 AI 训推全流程工具链 ModelEngine 亮相

华为在 2024 全球开源技术峰会上展示了 ModelEngine,这是业界首个开箱即用的 AI 训推全流程工具链。ModelEngine 集成了 AI 流式编程框架,为数据处理工程师、模型工程师和应用开发者提供一站式 AI 开发体验。它支持开放的数据处理算子、主流模型和应用算子,大幅缩短了语料生成时间,帮助开发者快速构建 AI 应用,并支持 LangChain、LlamaIndex 等插件,保护现有 AI 资产。

💫 企业动态

🔗 OpenAI 投的代码神器“叛变”了:Cursor 代码工具默认切换至 Claude,引发程序员热烈追捧

OpenAI 投资的代码工具 Cursor 将其默认模型更新为 Claude,尽管价格是 GitHub Copilot 的两倍,但因其强大的功能和便利性,如光标位置预测和多行编辑,以及跨文件编辑能力,获得了程序员的广泛好评。这一变化标志着 OpenAI 在代码生成领域的暂时失利,同时暗示了 Claude 在该领域的统治力。此外,Replit 等其他平台也开始集成 Claude,进一步证明了其影响力。

🔗 「不做人」了!这就是今年最糟糕的 AI 广告

Google 在奥运会期间推出的 Gemini AI 电视广告因不当展示其写作能力而备受批评。广告中 AI 的"不做人"宣传语被认为具有误导性,引发公众对 AI 技术应用的担忧和讨论。这起事件凸显了 AI 技术发展中需要遵循的伦理和规范问题,也反映出社会对 AI 的期待与担忧并存。

🔗 Apple Intelligence 存重大安全缺陷,几行代码即可攻破!Karpathy 发文提醒

Apple Intelligence 在 Beta 测试中被发现存在重大安全缺陷,开发人员 Evan Zhou 通过提示注入攻击成功操纵了 AI 系统,绕过了预期指令。这种攻击方式可导致数据泄露、生成恶意内容。技术安全专家 Bruce Schneier 指出,问题源于数据和控制路径未分离。Andrej Karpathy 也指出了类似 SQL 注入的漏洞,建议通过编程显式添加特殊 token 以增强安全性。

🔗 警惕!AI 生成的假马斯克成网络诈骗新宠

随着 AI 技术发展,深度伪造技术被用于网络诈骗,尤其是伪造埃隆·马斯克的视频,误导投资者造成重大损失。82 岁退休老人史蒂夫·比彻姆因观看伪造视频损失 69 万美元。社交媒体成为传播重灾区,监管难度加大。用户需提高警惕,核实信息真实性,避免成为诈骗目标。平台加强监管,用户提高自我保护意识,共同抵御诈骗威胁。

🔗 “远征 A2”来了!人形机器人独角兽「智元机器人」发布会如约而至

智元机器人宣布 8 月 18 日将召开新品发布会,届时将首次公开展示新款人形机器人“远征 A2”。自 2023 年发布远征 A1 后,公司未有进一步产品迭代或公开亮相。智元机器人获得北汽等产业投资,股东包括三大主机厂,成为国内人形机器人企业的佼佼者。市场期待此次发布会能透露更多关于远征 A2 的技术迭代和商业化进展,以及智元机器人在人形机器人领域的新突破。

🔗 软银与英特尔合作失败!

软银原计划与英特尔合作开发 AI 芯片以挑战英伟达,但因英特尔未能满足产量和速度要求,合作失败。孙正义原计划投资数十亿美元,推动软银成为 AI 领域的中心。尽管合作未果,软银仍寻求其他合作伙伴,并继续向谷歌、Meta 等科技巨头推销其 AI 项目。英特尔近期宣布重大成本削减措施,包括裁员约 15000 人,占员工总数 15%,以实现 2025 年节约 100 亿美元的目标。

✨ 行业观点

🔗 联想杨元庆:AI 绝不是泡沫,不要千军万马走一个独木桥

联想集团董事长杨元庆坚信 AI 技术非泡沫,看好其在各行业的应用前景。联想通过发展混合智能,结合公共与私有 AI,实现业务增长。2024/25 财年首季营收和净利润均大幅增长,AI PC 市场潜力巨大,智能手机业务在亚太、欧洲-中东-非洲地区增长强劲。联想在云基础设施领域也取得显著进展,积极推动 AI 在企业级应用中的落地。尽管面临研发和库存挑战,联想保持技术领先,杨元庆对 AI 未来充满期待,预言个人用户将拥有"AI 代理"或"AI 双胞胎"。

🔗 硅谷知名投资人 Elad Gil 最新洞察:开源若追上闭源,将显著改变 AI 寡头垄断格局

硅谷知名科技投资人 Elad Gil 预测,未来几年 AI 领域将形成由几家巨头公司主导的寡头垄断局面。然而,开源模型如 Meta 的 LlaMA 若能迎头赶上,可能会引发行业变革,经济价值将由闭源提供商转移至云服务商。Gil 认为,随着大型语言模型的迭代,AI 能力将大幅提升,为医疗、教育等领域带来新的市场机会。同时,他探讨了社会进步、创新加速以及 AI 对人类社会的深远影响。

🔗 Nature 曝惊人内幕:论文被天价卖出喂 AI!出版商狂赚上亿,作者 0 收入

Nature 杂志披露,学术出版商如 Taylor & Francis 和 Wiley 通过向科技公司出售论文数据赚取巨额利润,而论文作者却未获任何回报。学术论文成为训练 AI 模型的宝贵数据源,但版权争议和作者权益问题随之浮现。尽管存在技术手段尝试识别论文是否被用于 AI 训练,但证明难度极高。同时,多模态数据集的构建,如利用 arXiv 论文中的图文,为 AI 模型提供了新的训练资源,提升了模型在特定领域的能力。

🎡 热门活动

🔗 AI Talk沙龙-第3期|2024.8.24下午14:30|线下分享+线上直播(https://agijuejin.feishu.cn/wiki/Lw0iwxKgUiD9uRkTkXScWYNbnZd)

🔗 AGI 掘金 x 飞书 智能会议纪要 - 体验邀请

(https://juejin.cn/post/7400609489789403175)

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊(https://sourl.co/G5Gpqh)


文章来源: https://mp.weixin.qq.com/s?__biz=MzI1MzYzMjE0MQ==&mid=2247508874&idx=3&sn=bf9a23bfda5a6be3b6cc0e2e972442b8&chksm=e9d36868dea4e17e274c8619a20dc94f50dc2490c9a79fe0425bebe62034cfcfbefec5c40c24&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh