搜索 AI Search Rules & Tips
1. 遵守中国大陆相关法律法规
2. 请勿滥用 AI 答案作为跟帖
3. 推荐:Free ChatGPT List
4. AI 作品:〈云游博物馆〉

AI上周热点#006

查看: 1078|回复: 1
shubuluoage 发表于 2024-12-22 20:49:11
AI 总结
DeepMind推出Veo 2,一款新的视频生成AI,能够生成高达4K分辨率的两分钟视频,超越OpenAI的Sora。Pika Labs发布了AI视频生成器2.0,新增“场景成分”功能,允许用户将自己的图像融入AI生成的视频。DeepMind还推出了Project Mariner,一个可以代替用户在网络上互动的AI代理。微软发布了Phi-4,一个新的生成AI模型,特别擅长解决数学问题。其他新闻包括苹果与Siri的ChatGPT集成、OpenAI的ChatGPT搜索引擎向所有用户开放、以及Meta推出的Apollo视频理解模型等。

以下全文
[谷歌DeepMind推出了一种新的视频模型,以与Sora竞争
DeepMind宣布了Veo 2,这是一款下一代视频生成AI,可以创建长达两分钟的4K分辨率视频,超越了OpenAI的Sora在分辨率和时长上的表现。Veo 2独家在谷歌的实验性视频创作工具VideoFX上提供,具有更好的物理和相机控制理解能力,能够生成更清晰的画面。该模型能够更真实地模拟运动、流体动力学和光的特性,包括不同的镜头和电影效果。公司还宣布对其商业图像生成模型Imagen 3进行了升级,该模型可以生成更明亮、构图更好的图像和照片,风格多样。

Pika Labs发布了带有新功能的AI视频生成器2.0
Pika Labs推出了其AI视频生成器的2.0版本,推出了一项名为“场景成分”的重要功能,使用户能够将自己的图像融入AI生成的视频中。该AI工具通过允许用户从各种视觉组件(如人物、物体、服装或环境的图片)构建场景,AI随后确定每张图像的用途并将它们合并成一个功能性场景。这个更新的视频生成器还具有增强的视觉质量和改进的提示遵循,将向所有用户开放,包括欧盟的用户,这与OpenAI的Sora形成对比,后者仅对专业订阅者完全开放。

谷歌推出海洋计划:人工智能代理为您使用网络
DeepMind推出了Project Mariner,这是一个可以代表用户与网络互动的AI代理。这个基于Gemini的代理可以控制Chrome浏览器,移动光标,点击按钮,并填写表单,模拟人类与网站的互动。该代理目前正在小范围内测试,可以执行诸如根据购物清单创建购物车或查找航班和酒店等任务。然而,它无法代表用户填写信用卡信息或接受Cookies。该代理在Chrome浏览器的最前面活动标签上工作,这意味着用户必须观看代理执行任务。

微软在研究预览中推出了新的生成性人工智能模型Phi-4
image1.jpeg
微软推出了Phi-4,这是其Phi系列生成性AI模型的最新成员,特别擅长解决数学问题,因为训练数据质量得到了改善。该模型由140亿个参数组成,目前在微软的Azure AI Foundry开发平台上有限访问,供研究使用。Phi-4的性能提升归功于使用高质量的合成数据集和人类生成的内容,以及未具体说明的后期训练改进。这次发布标志着自微软Phi模型开发的关键人物塞巴斯蒂安·布贝克离职以来,首次推出Phi系列模型,他已离开公司加入OpenAI。

image2.jpeg
苹果推出了Siri与ChatGPT的集成
苹果通过最新的软件更新为iPhone、iPad和Mac带来了Siri与ChatGPT的集成功能。这项更新不仅增强了Siri处理复杂查询的能力,还保护了用户隐私,标志着苹果在人工智能战略上迈出了重要一步。

ChatGPT搜索引擎现已向所有用户开放
OpenAI的ChatGPT搜索引擎已向所有用户开放使用。该版本包括一个经过优化的移动端界面,配备了高级语音模式,并提供类似传统搜索引擎的功能,如基于位置的图像和地图搜索结果。

OpenAI将其o1推理模型引入API——针对特定开发者
OpenAI的o1推理模型现在通过其API向部分开发者提供,提供了更好的定制和准确性,但成本更高且初始访问有限。

NVIDIA推出其最实惠的生成式人工智能超级计算机
NVIDIA的新型紧凑型生成式AI超级计算机通过软件升级提升了性能,价格更加亲民。

ChatGPT 增加了实时视频访问功能,可以“看到”你的手机所见
OpenAI正在为ChatGPT移动应用推出手机屏幕和实时视频共享功能,可在高级语音模式中使用。

Meta AI发布Apollo:一系列用于视频理解的新型视频-LMMs大型多模态模型
Apollo模型引入了创新技术,如fps采样和双视觉编码器,以增强视频理解,在视频语言任务中实现了强大的性能,同时为现实世界应用提供了可扩展的解决方案。

Meta推出了一款用于给AI生成的视频添加水印的工具
Meta Video Seal,一个开源工具,用于给AI生成的视频添加水印,以应对深度伪造的兴起,提供对常见视频编辑和压缩的抵抗力,同时通过公开排行榜和合作倡议鼓励行业采用。

OpenAI推出Projects功能助力ChatGPT对话管理
OpenAI为ChatGPT新增的Projects功能让用户能更好地管理和定制对话内容。该功能集成了画布支持和网络连接,使用户可以轻松处理项目管理和个人网站创建等任务。

image3.jpeg
Databricks将在新一轮融资中达到620亿美元的估值
Databricks正在筹集100亿美元的资金,以达到620亿美元的估值,计划投资于人工智能产品、收购和国际扩张,同时为未来可能的公开上市做准备。

OpenAI 发布电子邮件显示马斯克曾希望将 OpenAI 转为营利组织
OpenAI 正在反驳马斯克的诉讼,公布的邮件显示这位联合创始人本人曾希望将 OpenAI 转型为营利性公司。讽刺的是,马斯克现在却在起诉阻止 OpenAI 进行这样的转型。

image4.jpeg
AI错误认为膝盖X光片能显示饮酒习惯——这完全不成立
医学影像中的AI模型可能会通过捕捉到意外的数据关联而得出误导性结论,这凸显了对AI系统进行严格评估的重要性,以避免产生错误的临床判断。

更多咨询在微信公众号“鼠部落”首发
本周刊每周更新,欢迎您关注、点赞、转发!
qrcode_for_gh_b6de92c752f6_258.jpg
下课再聊 发表于 2024-12-23 09:25:14
很棒,很全面,对于墙内的人,可以说是整合了信息
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-5-2 05:56

快速回复 返回顶部 返回列表