AI视野：多模态ChatGPT即将上线；抖音“AI美式证件照”走红；百度发布交通大模型“ACE3.0”_综合_时事

📰🤖📢AI新鲜事

多模态ChatGPT即将上线会看图、听声音、说话

OpenAI在美东时间9月25日宣布对ChatGPT进行重磅升级，实现了看图、听声音、输出语音内容的三大功能，为通用人工智能（AGI）迈出重要一步。

DeepMind研究:LLMs在图像和音频压缩方面出色表现

Google旗下的DeepMind研究人员发现，大型语言模型（LLMs）除了在文本领域表现出色，还在图像和音频数据的压缩方面具备出色能力，超越了专用的压缩算法如PNG和FLAC。

SambaNova发布全新AI芯片SN40L，可运行5万亿参数模型

SambaNova发布了一款新型AI芯片SN40L，支持运行高达5万亿参数的大模型，提升模型质量和推理速度，降低总体拥有成本。

SK电讯宣布AI金字塔战略，力争成为全球AI巨头

SK电讯宣布AI金字塔战略，加速创新与投资，重点聚焦AI基础设施、转型和服务，力争成为全球AI巨头。

Snap 与微软合作在其「My AI」聊天机器人对话中投放广告

Snapchat 与微软合作，将在其 AI 产品 My AI 中插入广告。这个合作意味着用户与 AI 聊天机器人对话时，可能会收到与他们的查询相关的赞助商链接建议。这个广告形式类似于与对话相关的 Sponsored Links，而微软的广告业务正取得新的进展，与其他科技公司竞争合作伙伴。Snapchat 表示这一功能还处于早期实验阶段，但他们计划与更多合作伙伴合作，以增强 My AI。

哈佛研究发现GPT-4使得企业员工绩效提升了40%

哈佛大学领导的研究发现，使用生成式人工智能的波士顿咨询集团顾问的任务完成质量、速度和频率均有显著提升，相较不使用AI的同行，提高了40%的绩效。

抖音网友用AI生成各国版蜘蛛侠获赞6.7万

一位抖音网友使用AI软件生成不同国家风格的蜘蛛侠形象，获得了大量好评和点赞。这些蜘蛛侠形象充满了各国的特色和代表性元素，例如中国风格的武侠风、冰岛冰霜气息、牙买加的红黄绿经典三色以及沙特的富裕感。目前，该系列作品已获得6.7万点赞。

抖音上线“亚运加油盲盒”AI特效

抖音官方在杭州亚运会期间推出了“亚运加油盲盒”AI特效，可以给用户照片添加卡通化的亚运造型，已有超过147万人使用。

抖音“AI美式证件照”走红相关话题播放量过亿

AI生成的证件照模板越来越受欢迎，抖音上AI美式证件照话题播放量过亿，但部分网友认为生成效果不太像。

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

富士通推出两项新技术可检测对话型AI中的幻觉和网络钓鱼网址，以提高对话型AI的可靠性和安全性。

DeepMind利用无监督学习开发AlphaMissense，预测7100万种基因突变

DeepMind开发AlphaMissense，利用AlphaFold模型预测蛋白质结构，再结合无监督学习对7100万种基因错义突变进行预测，在多个数据集上的预测正确率达90%以上。

论文地址:https://www.science.org/doi/10.1126/science.adg7492

💻💡🎯聚焦开发者

Rerender A Video源代码放出!解决AI视频闪烁问题

Rerender A Video项目通过零训练的文本引导视频到视频翻译框架，实现了低成本的时间一致性，解决了AI视频闪烁问题。

项目地址:https://github.com/williamyang1991/Rerender_A_Video

高效开源LLM框架Haystack 助力打造高效应用程序

Haystack是一个端到端的自然语言处理框架，能够帮助构建由大型语言模型、Transformer模型、向量搜索等驱动的应用程序。

项目地址:https://github.com/deepset-ai/haystack

万能AI编程工具包插件Sidekick 提供个性化编程帮助

文章介绍了微软开发的万能AI编程工具包插件Sidekick，通过GPT-4引擎提供支持，根据用户编程习惯提供个性化编程帮助，提高编程效率。

体验地址:

https://marketplace.visualstudio.com/items?itemName=InvisibleTools.sidekickai&%3Butm_source=9527ai&utm_source=talkingdev.uwl.me

EmoPP模型开源:一款基于情感感知的韵律短语生成模型

EmoPP-Demo是一款基于情感感知的韵律短语生成模型，通过预测短语分隔符来提升端到端文本转语音的自然度和情感表达能力，开源代码在GitHub。

地址:https://ai-s2-lab.github.io/EmoPP/

🤖📱💼AI应用

Getty Images与Nvidia合作开发生成式AI图片工具

图片库巨头Getty Images与芯片制造商Nvidia宣布合作，共同开发生成式AI图片工具，这引发了有关创作者应获取创作权的争议，将推动思考AI如何影响文化创意产业。

Spotify 将使用 OpenAI 人工智能技术克隆播客声音

Spotify正在测试使用OpenAI的语音生成技术，让播客主持人用自己的声音模拟不同语言版本，以方便触达其他语言区的听众。

🤖📈💻💡大模型动态

百度智能云发布交通行业大模型“ACE3.0”

百度智能云在全球可持续交通高峰论坛上，发布了基于大模型重构的智能交通解决方案ACE3.0，利用大模型的知识压缩能力，实现对交通行业的AI原生重构。

什么值得买开发大模型

值得买表示，大数据和大模型是公司非常关注的领域，公司已经在该领域加大了投入。在大数据层面，目前随着公司逐步沉淀来自于消费内容业务板块和营销服务业务板块等的更多数据资源，已形成一个能够涵盖人、货、场等多种维度的底层数据体系。

聆心智能开源定制角色对话交互模型CharacterGLM-6B

聆心智能发布了CharacterGLM-6B模型，用于定制化角色对话。该模型基于ChatGLM模型，有6B、12B和66B三个不同参数量的版本。聆心智能将开放12B和66B模型的API访问，并开源CharacterGLM-6B模型，以促进AI角色扮演和AI在心理学中的应用。性能评估结果显示，CharacterGLM在大多数类别和话题下表现优于竞争对手，并提供了不同类别角色的对话交互效果示例。

开源地址:

https://huggingface.co/LingxinAI/CharacterGLM-6b

API调用地址:

CharacterGLM API: https://bigmodel.cn/dev/api#characterglm

（举报）

快好知 kuaihz 订阅 观点

AI视野：多模态ChatGPT即将上线；抖音“AI美式证件照”走红；百度发布交通大模型“ACE3.0”

iPhone SE 4曝光！京东...

创造新纪录，他们打响抖音电商“双...

超5亿人“上头”，“抖快号”和“...

最新看过  赞过

最新 看过 赞过

最新看过赞过