AI及信息技术应用2024年6月16日简报
上周AI产业迎来一系列创新突破。阿里巴巴云推出Qwen2系列模型,苹果在WWDC 2024上宣布Apple Intelligence,Together AI展示MoA技术,美图发布MOKI视频创作产品。Mistral AI获得巨额融资并推出微调工具,英伟达开源超大规模模型Nemotron-4 340B。OpenAI推出函数调用微调功能,PowerInfer-2框架提升智能手机AI性能。谷歌研究个性化健康体验,Databricks发布Mosaic AI工具。ElevenLabs和iGenius分别在音频和语言模型上取得进展。快手的Kling模型和苹果的Siri更新,进一步推动AI在内容创作和智能助手领域的应用。同时,合规和监管成为焦点,FTC审查AI技术,OpenAI加强安全措施,苹果CEO强调AI准确性,北约资助战争机器人研发,Gretel AI发布金融数据集,AI在政治领域也引起讨论。
1,AI产业及应用研究
阿里巴巴云发布 Qwen2 系列开放模型
[摘要]:阿里巴巴云发布了 Qwen2 系列的五种规模模型:0.5B、1.5B、7B、57B-14B(MoE)、以及在 29 种语言数据上训练的 72B。Qwen2-72B 在性能上超越了 Llama-3-70B,相较于前身 Qwen1.5-110B 参数量减少但性能提升。除了 72B 版本使用原始的 Qianwen 许可外,其余模型均采用 Apache 2.0 许可发布。
苹果在 WWDC 2024 上宣布 Apple Intelligence
[摘要]:在 WWDC 2024 上,苹果宣布了 Apple Intelligence,一套新的 AI 功能,适用于 iPhone、Mac 等设备。今年晚些时候,苹果将推出更具对话性的 Siri、自定义 AI 生成的“Genmoji”和 GPT-4o 支持,以处理复杂查询。这些 AI 功能将跨应用执行操作、管理通知、自动写作和总结文本。苹果强调其隐私保护系统,数据交换将加密并随后删除。这些功能仅适用于 iPhone 15 Pro、15 Pro Max 和配备 M1 或更高芯片的 iPad 和 Mac。
Together AI 推出混合代理(MoA)
[摘要]:Together AI 推出了 Mixture of Agents (MoA),一种利用多个大语言模型 (LLMs) 集体优势的新方法。MoA 采用分层架构,每层包含多个 LLM 代理。仅使用开源模型,MoA 在 AlpacaEval 2.0 中超越了 GPT-4o 的表现。此创新方法展示了协同多模型架构在提升 AI 性能方面的潜力。
美图发布6款新产品,其中MOKI表现出色
[摘要]:美图刚刚发布了6款新产品,其中 MOKI 表现出色,让人人都可以创作短片(视频)。MOKI 支持创作多种类型的 AI 短片,包括动画短片、网文短剧、故事绘本和 MV 等。该产品涵盖视频的前期设定、内容生成和后期制作,简化了短片制作流程。MOKI 将于7月31日上线。
Mistral AI 获得 6.4 亿美元融资
[摘要]:巴黎的 AI 初创公司 Mistral AI 成功获得了 6.4 亿美元的融资。这笔资金将用于推动其人工智能技术的发展和市场扩展。Mistral AI 致力于开发先进的 AI 解决方案,以应对各种复杂的商业和技术挑战。这次融资显示了投资者对 Mistral AI 快速增长和技术实力的高度认可。
英伟达开源 3400 亿参数大模型 Nemotron-4 340B
[摘要]:英伟达开源了 Nemotron-4 340B,这是一款具有 3400 亿参数的超大规模语言模型,性能可媲美 GPT-4。这一举措标志着开源浪潮席卷 LLM 领域,为开发者和研究人员提供了强大的工具,以推进自然语言处理和生成技术的发展。
OpenAI 发布函数调用微调功能
[摘要]:OpenAI 推出了一项新功能,允许用户对 AI 模型进行函数调用微调。这项功能使得 AI 模型在触发预定义函数时能够提供更准确和一致的输出,从而提升模型在特定任务中的表现。这种微调方法有助于开发人员创建更精确的应用,满足不同领域的特定需求。
PowerInfer-2: 智能手机上的快速大语言模型推理
[摘要]:PowerInfer-2 是专为智能手机设计的高效推理框架,支持 Mixtral 47B MoE 模型,推理速度达每秒 11.68 token,比其他框架快 22 倍。其主要特点包括异构计算和 I/O-计算流水线,显著节省内存并提升解码速度。PowerInfer-2 在智能手机设备上表现出卓越性能,支持部分卸载模型权重。引入的 TurboSparse-Mistral-7B 和 TurboSparse-Mixtral-47B 模型,实现了更高的可预测稀疏性和模型性能。
谷歌发布 AI 个性化健康体验研究
[摘要]:谷歌发布了关于 AI 如何创建个性化健康体验的研究。Personal Health Large Language Model (PH-LLM) 是对 Gemini 模型的微调版本,旨在生成与睡眠和健身模式相关的健康行为见解和建议。PH-LLM 使用多模态编码器,优化了文本理解和推理,以及对可穿戴设备的原始时间序列传感器数据(如心率变异性和呼吸率)的解读。
Databricks 推出五款新的 Mosaic AI 工具
[摘要]:Databricks 推出了五款新的 Mosaic AI 工具,包括 Mosaic AI Agent Framework、Mosaic AI Agent Evaluation、Mosaic AI Tools Catalog、Mosaic AI Model Training 和 Mosaic AI Gateway。这些工具旨在提供一个综合平台,帮助开发者和数据科学家高效构建、评估、管理和部署 AI 模型,进一步提升 AI 项目的实施效果和效率。
人工智能生成的音效来了
[摘要]:ElevenLabs 推出了新的 AI Audio 模型,能够根据文本提示创建各种音效、音轨和声音。这项技术利用 Shutterstock 的音频库,帮助媒体专业人士快速、可扩展地制作高质量音频,简化音频设计流程。用户可以通过 ElevenLabs 的平台轻松生成所需声音,从而提升内容创作的效率和质量。
iGenius 计划以 17 亿欧元估值筹集资金
[摘要]:意大利生成式 AI 初创公司 iGenius 正计划以 17 亿欧元(18.3 亿美元)的估值筹集 6.5 亿欧元(6.98 亿美元),从而成为独角兽初创公司。iGenius 最近发布了 Italia 9B,这是一款具有 90 亿参数的开源基础法学硕士课程模型,能够理解意大利语言和文化的细微差别。iGenius 与意大利最大的计算中心 Cineca 合作,旨在与法国的 Mistral AI 和德国的 DeepL 在欧洲 AI 领域竞争。
快手发布文本转视频模型 Kling
[摘要]:快手科技发布了 Kling,一款能够制作长达两分钟 1080p 高清视频的文本转视频模型。Kling 具备生动的视觉效果和逼真的动作,采用先进的 3D 人脸身体重建技术和专有的 3D VAE 技术,性能可能与 OpenAI 的 Sora 模型相媲美。这一创新工具将极大提升视频内容创作的效率和质量。
Mistral AI 推出微调 API 和 SDK
[摘要]:Mistral AI 推出了用于定制 AI 模型的微调 API 和 SDK,这些工具在其平台 La Plateforme 上提供。基于 LoRA 训练范式的开源 SDK 允许开发人员在自己的基础设施上微调模型。La Plateforme 还提供无服务器微调服务,适用于 Mistral 7B 和 Mistral Small 模型,实现经济高效的模型定制,并计划在未来扩展兼容性。
2,产品市场创新
苹果 WWDC 2024 亮点与要点
[摘要]:在 WWDC 2024 上,苹果发布了一系列重要更新,包括 iOS 18、watchOS 11、iPadOS 18 和 macOS Sequoia。亮点包括增强的 Siri 功能、全新的 Apple Intelligence 系统、升级的 visionOS 2 以及 Safari 的改进。iOS 18 增强了个性化和安全性,watchOS 11 提升了健康功能,iPadOS 18 提高了生产力,macOS Sequoia 改善了跨设备协作。
iOS 18 更新后短信功能的变化
[摘要]:iOS 18 更新将带来一系列改进,使短信体验更加便捷和智能。新功能包括更强大的自动回复、增强的文本预测、改进的表情符号建议以及对多媒体消息的更好支持。这些改进旨在使用户的沟通更加流畅、高效,并提升整体使用体验。
雅虎推出新的 AI 新闻应用
[摘要]:雅虎推出了一款新的人工智能新闻应用,采用其 4 月份收购的应用 Artifact 的底层技术。该应用允许用户根据自己的兴趣创建个性化新闻推送,并包括“Key Takeaways”等功能,还能标记和重写点击诱饵标题,提升用户的阅读体验。
LinkedIn 推出全新 AI 职业教练
[摘要]:LinkedIn 推出了以职业专家为原型的 AI 职业教练,提供个性化反馈,并推出了 AI 生成的求职信和简历微调功能。改进的搜索功能让用户更容易找到特定的同事或公司。招聘人员还可使用 AI 生成的消息联系候选人。这些工具旨在帮助用户提升职业技能和求职效率,同时平衡人力资源部门面对大量 AI 生成申请的挑战。
Luma AI 在视频生成方面超越 OpenAI
[摘要]:Luma Labs 推出了 Dream Machine,这是一款能够根据文本和图像提示生成高质量、逼真的 5 秒视频片段的 AI 模型,并已向公众开放。与 OpenAI 的 Sora 不同,Dream Machine 提供流畅一致的输出,可以在 120 秒内生成 120 帧。免费计划包含 30 个视频生成,付费套餐每月最多提供 2,000 个输出。
Elai 推出互动 AI 视频生成工具
[摘要]:Elai 推出了一款新工具,能够根据文本生成互动式 AI 视频,包含测验和热点功能。用户可以创建基于头像的学习视频,通过游戏化的互动方式提高学习效果。免费计划和付费套餐可用,帮助用户更好地掌握培训材料。
3,合规和监管
FTC 将审查人工智能
[摘要]:美国联邦贸易委员会(FTC)主席莉娜·汗宣布,该机构将全面审查人工智能技术,以确保初创企业的公平竞争,不会通过过度监管扼杀它们。FTC 关注语音克隆欺诈等潜在危害,并鼓励市场解决方案来检测和预防与人工智能相关的欺诈。此外,FTC 正在提高其技术专长,以确保人工智能的真正开放性,并防止关于人工智能产品的欺骗性广告和夸大其词。
Paul Nakasone 加入 OpenAI 董事会以加强安全措施
[摘要]:OpenAI 宣布,美国国家安全局前局长 Paul Nakasone 加入董事会,旨在进一步加强 AI 技术的安全和伦理监督。他将与现有团队合作,确保 AI 技术在安全和合规的环境中发展,为公司在快速发展的 AI 领域提供战略指导。
Tim Cook谈如何阻止 AI 幻觉
[摘要]:苹果 CEO Tim Cook 表示,苹果正在努力解决 AI 系统中的“幻觉”问题,即 AI 生成的虚假或误导性信息。通过改进 AI 模型和算法,苹果希望提升 AI 的准确性和可靠性,确保用户获得更可信的结果。Cook 强调了在开发 AI 技术时对用户隐私和数据安全的重视。
北约资助德国初创企业研发自主战争机器人
[摘要]:北约创新基金向德国机器人初创公司 ARX Robotics 提供了 900 万欧元的种子投资,以开发用于战场的无人地面机器人。ARX Robotics 提供四种模块化机器人,类似于没有枪的小型坦克,可运载重达 500 公斤的士兵,包括受伤士兵,并配备雷达、扫雷设备或医疗担架。
Gretel AI 发布多语言合成金融数据集
[摘要]:Gretel AI 在 HuggingFace 上发布了一款新的多语言合成金融数据集,帮助 AI 开发人员解决个人身份信息 (PII) 检测问题。该数据集旨在满足不同领域的特定需求,遵守如 GDPR 等法规要求。Gretel 的 Navigator 工具允许开发者创建定制的合成数据集,减少手动标记的时间和成本,确保 PII 检测模型能够准确应对实际应用场景。
教皇方济各警告 G7 领导人警惕人工智能的力量
[摘要]:在意大利博尔戈埃格纳齐亚举行的七国集团峰会上,教皇方济各向全球领导人发表讲话,强调了在人工智能技术开发过程中进行道德监督以保障人类生命和尊严的重要性。他承认人工智能在推动科学研究方面的潜在益处,但也警告了错误信息传播和就业市场混乱的风险。
人工智能候选人“AI Alex”震撼美国国会竞选
[摘要]:由企业家亚历克斯·约翰逊支持的人工智能候选人“AI Alex”将在即将到来的美国国会选举中竞选,作为独立候选人参选。公民可以在线与 AI Alex 互动,讨论政策问题并提供意见,人工智能将利用这些意见塑造其平台。一旦当选,约翰逊将作为 AI Alex 的代表,根据 AI 数据驱动的政策在国会投票。这引发了关于人工智能在政治中作用的广泛讨论。
AI Steve:英国政坛的 AI 候选人
[摘要]:在即将举行的英国大选中,人工智能候选人“AI Steve”将参与议会竞选。这一举措由苏塞克斯商人 Steve Endacott 推动,旨在提升政治参与度和响应度。AI Steve 通过网站回答政策问题,收集选民意见,并根据支持率调整政策。Endacott 希望通过智慧英国党推动政府改革,减少碳排放,并利用 AI 增强选民互动,展示 AI 在提高政治参与度和民主中的潜力。

