AI及信息技术应用2024年3月24日简报

Mar 24, 2024

在上周的AI产业及应用研究领域有着众多新故事，马斯克的公司xAI将其创新的巨型AI模型Grok-1开源，这是目前开源的参数量最大的语言模型，是对AI研究人员的巨大提携。另一方面，Inflection AI CEO及团队的加盟，则预示着微软在AI领域将起到更大作用。新兴创新项目StreamMultiDiffusion则展露现今AI技术在实时图像生成领域的强大实力，尤其是在即时编辑和反馈方面的实用性。

值得注意的是，反映AI在医疗领域应用的好例子——Hippocratic AI与GenAI的联手推出了一款创新的护士服务，该服务利用AI技术提供高效医疗支持，让人看到了AI对医疗行业的重大影响力。

但同时，人工智能也找到了更个性化的应用，如Podwise——一款能自动提取播客内容生成逐字脚本、大纲、关键字和脑图的应用，进一步提升了播客内容的学习和回顾效率。上周，马斯克、微软、英伟达、谷歌、苹果、inflection AI等，月之暗面的kimi支持200万字上下文，都给AI主题增添了话题。

1，AI产业及应用研究

马斯克的公司xAI开源巨型AI模型Grok-1

摘要：马斯克的公司xAI刚刚公开了他们的巨型人工智能模型Grok-1，这是目前开源的参数量最大的语言模型，拥有3140亿的参数。此举不仅为AI研究人员提供了一个新的研究工具，同时也在开源与否的辩论中，表明了马斯克支持开源技术的立场。

Inflection AI CEO及团队加盟微软，推动Microsoft AI整合与创新

摘要： 近日，Inflection AI的首席执行官兼创始人宣布，他将携手另一位创始人及部分核心团队成员加入微软，担任Microsoft AI CEO一职。这一战略性人事变动预示着微软将在AI领域迈出重要一步，计划将消费者AI工作、Copilot、Bing搜索引擎和Edge浏览器等业务进行深度整合。同时，Inflection AI将在Microsoft Azure云平台上托管其最新的Inflection-2.5系统，并向公众开放API，以促进更广泛的技术合作与应用Inflection AI自成立以来，已累计融资超过15亿美元，估值更是超过了40亿美元。

StreamMultiDiffusion：开创性的实时交互式文本指导图像生成项目

摘要：StreamMultiDiffusion是一项重塑人们创作方式的创新项目，通过区域文本提示实现实时交互式图像生成。用户可以对生成图像的具体区域进行精细控制，同时实现即时的编辑和反馈。此外，该系统还引入了语义调色板，用于创建具有特定语义的内容，从而为用户提供了一种全新的绘画体验。

Kimi智能助手引领行业前沿，实现200万字超长无损上下文的里程碑突破

摘要： Moonshot AI 的 Kimi智能助手近期达成了一个研发里程碑——成功处理超过200万字的无损上下文，使得Kimi智能助手成为目前业内性能最领先的AI。超长无损上下文技术在提升用户体验，改善长文本处理性能方面具有独特优势。

零一万物开放研发的笛卡尔向量数据库搜索内核

摘要：零一万物近日宣布，其自研向量数据库“笛卡尔”（Descartes）现已全面开放搜索内核，并提供免费商用许可。作为大模型检索增强生成（Retrieval-Augmented Generation, RAG）的核心技术之一，“笛卡尔”在ANN-Benchmarks 6项数据集评测中荣获第一名，表现出在大模型场景下具有超高精度和超快速度的能力。此次开放旨在更好地服务AI 2.0产业的发展，并为大模型开源社区技术工具提供了更多选择。

HyperGAI发布多模态大语言模型HPT：重新定义交互式AI

摘要： HyperGAI的最新多模态大语言模型HPT旨在提升AI的跨模态理解与生成能力。HPT能处理包括文本、图像、视频等多种数据类型，理解它们之间的联系和互动，生成相应内容。HPT模型家族分为HPT Pro和HPT Air两个版本，其中HPT Pro在多个基准测试中超越了如GPT-4V和Gemini Pro等大型模型，而HPT Air版已开源，提供了高效且易于访问的多模态AI解决方案。

谷歌重组团队加速AI搜索创新，应对市场竞争

摘要： 谷歌首席执行官Sundar Pichai强调AI在提升搜索质量中的关键作用后，公司进行了重组，以加快AI搜索产品的发展。Liz Reid，原AI搜索功能负责人，现担任搜索主管；Cheenu Venkatachary，前AI产品开发负责人，现监督搜索质量。这一战略调整可能是为了应对市场上新兴的人工智能搜索引擎，如Perplexity，它们正挑战传统的在线搜索方式。

Hippocratic AI 推出 GenAI 护士服务，时薪 9 美元革新医疗行业

摘要： Hippocratic AI 近期宣布与 GenAI 合作，推出一项创新的护士服务。该服务将利用人工智能技术，提供每小时 9 美元的高效医疗支持。这一举措旨在通过AI技术优化医疗资源分配，降低成本，同时提高医疗服务的可及性和质量。

Truecaller 引入先进AI功能，强化垃圾电话识别与拦截

摘要： Truecaller 最近更新了其应用程序，新增了基于人工智能的功能，旨在更有效地检测和阻止垃圾电话。这些新功能将利用AI技术提升对骚扰电话的识别精度，并增强用户的手机安全防护，从而为用户提供更加清净的通话环境。

Apple 探索与 Google 合作，在 iPhone 中集成 Gemini AI

据报道，苹果正在与谷歌讨论将 Gemini AI 模型引入 iPhone 功能中，目标是在今年晚些时候通过 AI 功能增强 iOS 更新。在人工智能领域竞争日益激烈的情况下，苹果已经考虑利用第三方人工智能技术，包括谷歌的 Gemini 和潜在的 OpenAI 的 GPT 模型，用于生成人工智能应用程序，例如图像创建和写作辅助。虽然苹果可能会在即将推出的 iOS 18 更新中利用自己的人工智能模型来实现某些设备上的功能，但与谷歌的合作可能标志着一次重大合作，进一步巩固谷歌在 iPhone 上作为首选搜索引擎提供商的地位。

MovieLLM：AI驱动的电影生成框架，提升长视频内容理解

摘要： MovieLLM开辟了长视频内容创作的新篇章，这一框架结合了GPT-4的文本生成能力和文本到图像模型的视觉效果，创造出高质量的合成数据。通过生成详尽的脚本和匹配的视觉内容，MovieLLM不仅增强了对长视频的理解，也为电影制作和内容分析提供了新的工具。

Nvidia GTC大会：推出Blackwell芯片架构与先进AI工具集

摘要： 在Nvidia的GTC开发者大会上，CEO黄仁勋宣布了一套全新的工具，旨在推动AI技术的发展。这包括创新的Blackwell芯片架构、提速网络技术、简化自定义AI工具开发的NIM平台、增强的Omniverse Cloud API模拟功能，以及革命性的机器人基础模型GR00T。这些工具的推出标志着Nvidia在AI领域的领先地位进一步巩固。

NVIDIA Blackwell B200 GPU和GB200：AI性能飞跃，成本能耗大降

摘要： NVIDIA最新发布的Blackwell B200 GPU和GB200 AI芯片组，实现了AI模型性能的30倍提升，同时将AI模型运行的成本和能耗降低了25倍。这一突破性进展不仅极大增强了AI处理能力，还大幅降低了使用门槛，为AI技术的发展和应用带来重大影响。

AIport发布2024全球生成式人工智能(GenAI)全景图

摘要： AIport最新研究报告展示了全球GenAI技术的快速发展，特别是在ChatGPT发布后，GenAI在多个领域的应用迅速增长。尽管目前的关注多集中在硅谷和欧洲的技术巨头，AIport的研究显示GenAI在全球范围内的35个国家均有显著进展。北美以38家公司位居GenAI发展前沿，紧随其后的是欧洲的27家和亚洲的28家。报告还指出，多模态GenAI模型的发展在美国尤为突出，而欧洲在商业智能和文本类别中表现突出。AIport认为，与其他技术浪潮相比，GenAI在转型价值上具有最大的潜力，因为它模仿人类能力的能力是前所未有的。尽管技术仍处于早期阶段，但商业领袖已经认识到GenAI在自动化和辅助功能方面的重大价值。

2，产品市场创新

Podwise：播客爱好者的知识管理革命

摘要： 播客爱好者们现在有了一款强大的AI助手——Podwise，这是一款专为播客听众设计的知识管理应用。Podwise通过AI技术从播客中提取关键信息，自动生成逐字脚本、大纲、关键字和脑图，帮助用户高效整理和回顾播客内容。用户可以在Podwise中订阅他们喜欢的播客节目，并在新剧集发布时迅速获取结构化的知识摘要。此外，Podwise还提供了智能总结功能，支持边听边看，以及与Notion、Obsidian、Readwise等知识管理工具的无缝连接，极大地提升了播客内容的学习和回顾效率。这款工具不仅解决了播客内容难以记录和回顾的问题，也为播客爱好者们带来了全新的知识管理体验。

微软引领AI计算革新：全球首款人工智能电脑Surface Pro 10与Surface Laptop 6亮相

摘要： 微软最新发布的Surface Pro 10和Surface Laptop 6商用版，被誉为全球首款AI PC。这两款设备装备了英特尔Core Ultra CPU，并引入了创新的Microsoft Copilot Key，旨在通过AI增强功能提升专业用户的生产力。产品仅通过微软网站和商业渠道销售，标志着计算领域的一个新纪元。

NVIDIA GR00T项目：开启类人机器人的新时代

摘要： Nvidia近日宣布启动GR00T项目，这是一个旨在提升人形机器人理解力和敏捷性的基础模型，使其具备类似人类的能力。通过GR00T，机器人将能够理解自然语言并模仿人类动作，快速学习在现实世界中的导航、适应和交互技能。Nvidia已联手Figure AI、Boston Dynamics、Apptronik等行业领导者共同推进该项目，预示着类人机器人时代的来临。

Stability AI面临研究人员流失，包括Stable Diffusion关键成员

摘要： 据《福布斯》报道，Stability AI，一家知名的AI图像生成公司，将失去其稳定扩散技术背后团队中的三名研究人员。其中包括Robin Rombach，一位来自慕尼黑大学的研究科学家，对开发广受欢迎的文本到图像生成器Stable Diffusion做出了贡献。自2022年以来，Stability AI发布了多个版本的Stable Diffusion模型，最近版本为3.0。此外，公司在过去一年中经历了一系列高层变动，包括首席技术官、产品、工程和研发副总裁的更换，以及研究主管和法学硕士主管的离职。去年，由于版权问题上的分歧，特别是对AI公司依赖合理使用原则的担忧，Stability AI的生成人工智能音频团队领导者Ed Newton-Rex也辞去了职务。

3，合规和监管

印度更新人工智能咨询，放宽模型发布规定

摘要： 印度修改了人工智能咨询意见，取消了推出人工智能模型之前需要政府批准的要求。在企业家和投资者强烈反对后，更新后的指导方针现在建议公司给未经测试或不可靠的人工智能模型贴上标签，以向用户强调潜在的不准确之处。这一转变背离了之前因可能扼杀创新而受到批评的指令，反映了印度对人工智能监管的细致入微的态度，强调透明度和用户意识而不是严格的政府控制。修订后的建议仍然强调防止非法内容、偏见、歧视和选举诚信威胁的传播，同时建议使用同意弹出窗口来告知用户人工智能生成内容的可靠性。

联合国大会通过AI决议，强调安全、可信和以人为本的发展

摘要： 联合国大会一致通过了一项关于人工智能的决议，该决议由美国首提，并获得中国及其他121国的支持。决议强调了对AI使用的“有效保障”，推动其“负责任和包容”的发展，并倡导保护个人数据、进行AI风险评估以及维护人权。目标是利用AI助力实现联合国2030年可持续发展目标，同时确保《世界人权宣言》及其宪章中消除战争的目标适用于AI发展。尽管决议具有全球共识，但不具备法律约束力。

谷歌因使用新闻内容训练Bard AI模型在法国被罚款2.5亿欧元

摘要： 法国竞争监管机构对谷歌处以2.5亿欧元（约2.7亿美元）的罚款，原因是该公司未经出版商同意，使用其新闻内容训练其Bard（现更名为Gemini）AI模型。法国官员指出，谷歌未能遵守其承诺，未允许新闻出版商选择退出AI模型的训练过程。法国ADLC发现谷歌未履行通知义务，并将退出选项推迟至2023年，影响了公平谈判。谷歌虽认为罚款过重，但接受了和解方案，承诺专注于与法国出版商的建设性合作，并同意提出补救措施。

AI及信息技术应用简报

Discussion about this post

Ready for more?