ITIMO创新库

实时信息流

仅保留近一个月的消息
  • 告别单轮傻瓜问答!云知声发布原生智能体大模型U2,自主攻克百步复杂工作流

    生成式人工智能正在加速从“只会聊天”的问答工具,演变为能够卷起袖子干活的“超级数字员工”。6月8日,云知声(9678.HK)正式发布了新一代通用大语言模型——U2。

    作为一款面向个人、开发者以及企业组织量身打造的原生智能体(Agent)大模型,U2彻底告别了传统大模型重依赖单轮对话的局限,将技术主线死死锚定在“高智能密度”与“高Token价值”的交付能力上。

  • C盘空间瞬间释放4GB!谷歌浏览器终于服软,新版 Chrome 允许彻底禁用并删除本地 AI 大模型

    在这个“无软件不 AI”的时代,各大应用都在不遗余力地往客户端塞进各种人工智能组件,但强行捆绑的策略也常常引发用户的反感。近日,全球市场份额第一的谷歌浏览器终于在用户长期的舆论压力下做出了妥协。在最新发布的Chrome149版本中,谷歌正式加入了设备端 AI 的禁用开关,饱受诟病的本地大模型强制常驻问题迎来了官方解决方案。

    此前,为了在浏览器内部深度集成 Gemini AI 功能,谷歌在过去多个版本的Chrome中引入了一项静默操作:系统会自动在后台下载一个名为 OptGuideOnDeviceModel 的本地 AI 大模型。该模型文件体积高达4GB,不仅对于绝大多数普通用户而言实用价值极其有限,还无故霸占了宝贵的 C盘 系统盘空间。


    伴随着Chrome149版本的推送,谷歌终于补上了这个缺失已久的控制权。现在,觉得该功能鸡肋的用户只需在浏览器地址栏输入“chrome://settings/system”进入系统设置页面,即可看到新增的设备端 AI 禁用选项。

    一旦用户选择关闭该功能,Chrome将会自动在后台清理并彻底删除这个4GB 的 OptGuideOnDeviceModel 模型,无需用户再手动去翻找复杂的系统隐藏文件夹。这一改动对于国内用户而言尤为实用,毕竟由于网络环境等客观因素限制,该本地 AI 功能在日常使用中本就难以正常外化,将其禁用并换回4GB 的纯净硬盘空间,显然是更务实的选择。

  • 孙正义:AI正在设计OpenAI下一个模型

    软银CEO孙正义表示,OpenAI的下一个模型正在由另一个模型设计,这是AI正在接近 “超级智能” 的一个迹象。孙正义周一在接受采访时表示,他曾与OpenAI CEO萨姆·奥尔特曼以及该公司的工程师们交流。他们告诉孙正义,“一个AI模型正在设计一个未来的模型”。

    “所以这也将发生在所有其他主要模型身上,”孙正义说,工程师的聪明程度将不足以设计下一个模型,“一旦这种情况发生,模型生成下一个模型……它的智能将呈指数级地超越我们所有人。这就是超级智能。”2024年,孙正义曾将超级人工智能(ASI)描述为比人类聪明一万倍的AI。当时,孙正义表示ASI将在10年内到来。孙正义周一表示:“在我心里,我当时认为它会在四年内到来,而不是十年。现在我认为它将在未来两年内到来。”

  • 关注AI行业(而不仅仅是炒股和体验产品),推荐一些我认为这一周里值得花时间认真看下的内容

    1、李飞飞关于当前被过度泛化的世界模型的定义; https://mp.weixin.qq.com/s/WLaF39Dq9caOUeSUSfz1HA

    2、coatue 的联创Thomas Laffont 在今年all in大会上的演讲(以独角兽切入,清晰描述当前市场状况) https://www.youtube.com/watch?v=UIoV8rG_25s&t=36s

    3、硅谷101最新的对田渊栋的采访,看看这位大佬如何看待当前最热的neolab们、大厂之间的竞争以及下一阶段的AI模型研发大家到底在bet什么 https://www.bilibili.com/video/BV1DY7C6nEWM/

    4、36氪的关于字节今年AI策略的稿子(世界模型、视频模型、coding、豆包商业化) https://mp.weixin.qq.com/s/uPSCDfm6MBi2n2c-j3ttHQ

    5、硅谷坐标最新一期关于neocloud的内容 https://mp.weixin.qq.com/s/v3VFaMwsiqea0fwWJtuGpA

  • OpenAI 拟对 ChatGPT 进行最大规模改版,打造“超级应用”

    OpenAI 计划对 ChatGPT 进行全面翻修,将其重塑为一款“超级应用”。此举旨在 IPO 前夕全力提升公司营收,并迎击来自谷歌及 Anthropic 的激烈竞争。 为了牢牢锁定高价值的企业客户,OpenAI 正将资源激进地向高生产力场景倾斜。

    该项目计划将核心产品 ChatGPT、编程辅助工具 Codex 以及浏览器产品 Atlas 整合进统一的桌面应用程序中,允许用户无需切换即可在一个界面内完成搜索、写代码与 AI 交互,同时削减多项边缘业务。高管直言“聊天已死”,认为能执行任务的代理比聊天更有商业价值。

    为支撑这场野心勃勃的重组并为今年内可能进行的股票上市铺路,OpenAI 正大举扩张团队,预计年底员工规模将从 4500 人暴增至 8000 人,加速向 AI 基础设施商转型。

  • 苹果新版 Siri 被曝将采用谷歌 Nvidia 芯片处理云端请求

    苹果计划在今年 9 月推出的新版 Siri,将把需要云端处理的 AI 查询交给 Google 数据中心,使用 Nvidia Blackwell B200 芯片运算,并通过 Nvidia 硬件加密保护用户数据。这与苹果一贯自研核心部件的做法不同,据称是因为其自研服务器运行 Gemini 模型的速度过慢。

    下周 WWDC 上,苹果将重点强调设备端 AI 能力,并有望重新介绍多次延迟的 Siri 个性化功能。Apple Intelligence 自 2024 年发布以来反响平淡,此次大会被视为苹果重塑 AI 叙事的关键机会。

  • 英伟达正式发布了新的 AI 游戏渲染技术 DLSS 5

    与常规的渲染方式不同,游戏先用低分辨率渲染,以节省显卡性能,然后再用 AI 模型,把画面放大并补充细节。

    这样可以让游戏,看起来像电影,但显卡负担更小。

  • 硅谷掀起了一波对 AI infra 的并购浪潮

    IBM 110 亿美元收购了做实时流数据的 Confluent,英伟达 9 亿美元收购做 GPU 超级互联和弹性内存池的 Enfabrica,高通收购了做 NPU 推理引擎的 Nexa AI,Meta 收购了做端侧 AI 的 Dreamer……

    这次和两个被硅谷大厂迅速收购的 infra 创业团队交流,明确了科技大厂当前的一个明确并购需求:巨头现在极度缺“时间”和“工程落地能力”。

    初创团队不建议去卷基础大模型,花期太短,某家巨头新模型一发布、一开源,你很可能就成了过眼云烟。

    但如果你做对了巨头生态里缺失的那块 Infra 拼图,无论是能帮硬件厂干完模型部署的“脏活累活”,或是帮巨头的推理效率提升一点,直接就能被溢价连人带代码买走。

    打不赢巨头,就去做巨头通向 AGI 路上最缺的那块砖,两年二三十倍估值速生速收,也是当前创业公司可以迅速完成闭环的一种“闪电战”打法。 这在硅谷至少是非常有效的模式。

  • ColaOS 正在招聘 Agent OS 的交互设计师和 Agent QA 岗位

    这两个岗位都会很有趣

    • OS 设计师几乎是把一切推翻重来,可以主导一个系统的交互定义

    • Agent QA 则是要把 Agent 用到极致,才能跟上今天工程师的节奏,甚至能以评估的方式推动他们工作

    工作地点北京海淀,交互设计师支持远程,QA必须本地

  • 2GB内存也能跑大模型!谷歌Gemini Go正式下凡,入门级安卓机迎来AI普惠

    在AI大模型疯狂内卷高端旗舰机型的当下,谷歌选择将目光投向了更为广阔的入门级市场。6月3日,谷歌正式宣布为Android Go系统引入全新的Gemini Go AI助手。这意味着,只要手机配备2GB以上的运行内存,用户就能在低配设备上体验到生成式AI的魅力。

    作为专为入门级设备打造的轻量化操作系统,Android Go旨在让存储空间和内存较小的手机也能流畅运行。此次推出的Gemini Go正是针对这一场景量身定制的“精简版”大模型。它能够在较小的存储空间内顺畅运行,全面取代原有的Google Assistant Go,成为Android Go设备上的默认智能助理。用户无需额外下载独立应用,只需通过长按Home键或电源键,即可随时唤醒这位AI助手。

    在功能层面,Gemini Go虽然进行了轻量化适配,但依然保留了强大的日常实用性。它支持代为拨打电话、发送短信、查询地图与驾车时间、搜索附近餐厅、设置闹钟、创建日历事件以及播放多媒体内容等常见任务。更值得一提的是,Gemini Go支持上传文档和照片,能够结合这些文件内容获取更多上下文信息,从而提供比传统语音助手更自然、更贴合需求的对话交互体验。