AI及信息技术应用2021年9月20日简报

Sep 22, 2021

本周人工智能应用方面，视频算法科研和工程技术进步，有不少新的成果，除了支持视频会议上的实时转译，同时在监管上也有很多新故事，从个人隐私保护、到演艺经纪的合规，技术、娱乐等各方面的社会协同发展上，都有新的举措。

01＃AI应用

[摘要]:Cohere在业界源自名门，其核心NLP模型正是源自Google Brain开发的Transformer，它可以理解、比较和生成复杂的文本，并不断改进训练数据。群里会第一时间发布最新的Transformer以及预训练大模型的前沿论文解读及交流分享会，主要设计方向有：图像分类、Transformer、知识图谱、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习习、人体姿态估计等内容。

视频基础技术在百度的应用

[摘要]:视频理解将主要介绍视频分类技术点视频基础技术在百度的应用视频分类技术是视频理解中的关键技术之一，视频分类技术和传统的分类技术相比有较大的差异，视频分类主要有以特点视频分类的计算量大，在单位时间内有较多的帧。视频方面的思路类似，通过文本空间+视频时序特征实现多模态学习，比在Youtube-8M训练集中，每个视频可能有一到多个标签，同样可以采用把视频的标签做一个label graph去学习每个label embedding feature，针对视频将不再采用空间这种attention机制，把视频在时序上做卷积，在每个时间段上，他们都可以跟其他的时间段去做attention机制，在跨模态方面，可以把每个label的feature和视频的每个segment的feature做跨模态分析，这会让视频分类效果有比较明显的提升。视频基础技术在百度的应用今年百度对注意力聚类网络模型进行了改进，这次改进主要针对两个问题，一是之前没有考虑对每个Attention输入的时序信息。

OpenAI CEOAltman在采访中表示，GPT-4 不会比 GPT-3 大，但会使用更多的计算资源

[摘要]:GPT-1 于 2018 年发布，GPT-2 于 2019 年，GPT-3 于 2020 年。如果按照这种模式，GPT-4 的发布可能指日可待。与流行的看法相反，GPT-4 不会比 GPT-3 大，但会使用更多的计算资源。重点是充分利用较小的模型。另一个主要讨论点是 DALL.E。Altman 表示 DALL.E 将公开发布。它是 GPT-3 的 120 亿参数版本，经过训练可以从文本标题生成图像。今年早些时候发布的 DALL.E 使用文本-图像对的数据集来执行各种任务，例如创建动物和无生命物体的拟人化版本、渲染文本、对图像应用转换，甚至结合不相关的概念。

人工智能初创公司 Sorcero 为语言智能平台筹集了 1000 万美元

[摘要]:Sorcero 支持企业的主题专家大规模地做出更好的决策。我们的语言智能平台专为 STEM 行业的医疗、保险和工程专家而设计，他们需要对大量复杂数据进行流畅和流畅的控制，以便每天为客户提供改变生活的服务。

Glean 以 5500 万美元从隐形中脱颖而出，为企业带来搜索

[摘要]:Glean 于周三悄然崛起，推出了一款辅助搜索工具，该工具可将来自数十个不同应用程序的信息汇集在一起,由于数据分散在如此多的软件中，无论它是Google Doc、旧的 Slack 消息中还是在 GitHub 存储库中的某个地方。它理解“季度目标”或“Q1 重点领域”在问同样的事情——并显示与其对应的所有结果，无论它们是位于 Salesforce、Slack 或公司使用的众多应用程序中的其他应用程序中。结果是根据用户的工作个性化的。

AI开放创新平台高峰论坛：华为、百度、小米8家人工智能“国家队”晒出了成绩单

[摘要]:在新一代人工智能开放创新平台高峰论坛上，昇腾战略与生态发展副总裁刘鑫，百度智能驾驶资深专家宋德王，科大讯飞高级副总裁胡国平，平安集团金融壹账通人工智能研究院总工程师徐亮，商汤研究院执行研究总监颜深根，360AI首席科学家邓亚峰，小米集团技术委副秘书长周珏嘉，旷视高级副总裁毛颖汇报了基础软硬件、自动驾驶、智能语音、惠普金融、智能视觉、安全大脑、智能家居、视频感知8个国家开放创新平台的工作进展情况。科大大讯飞胡国平：用AI语音技术赋能产业发展科大讯飞高级副总裁、研究院院长胡国平汇报了智能语音国家开放创新平台的工作情况。

由人工智能创建的社交媒体影响者/模型获得 100 项赞助

[摘要]:“Rozy”是去年 8 月由 Sidus Studio X 创建的虚拟人。她的年龄永远是 22 岁，自去年 12 月以来，她一直以真人的身份活跃在网上。尤其是，这个虚拟的人在7月份出现在新韩生活的广告中开始受到关注。虚拟人之所以受欢迎，是因为在选择AI模型作为广告模型后，不用担心会因令人讨厌的隐私丑闻而暂停广告。

ConvMLP：用于视觉的分层卷积 MLP

[摘要]:ConvMLP：一种用于视觉识别的分层卷积 MLP……一种轻量级、阶段性、卷积层和 MLP 的协同设计。”它被设计为“可扩展并无缝部署在下游任务上，如对象检测和语义分割”，在 ImageNet 上实现接近最先进 (SOTA) 的分类精度。此外，它在其他下游任务（如语义分割、对象检测和迁移学习）上表现出巨大的潜力。

Locus Robotics 收购 Waypoint Robotics

[摘要]:专注于仓库的自主机器人制造商 Locus Robotics 宣布以未公开的金额收购 Waypoint Robotics 。 Waypoint 专注于构建机器人以在工业环境中移动材料和工具。Locus Robotics 的目标是使用 Waypoint 机器人，通过支持更重的有效载荷和履行模式（包括托盘和箱子拣选）来实现其产品的多样化。

计算机视觉开发平台 Roboflow 融资 2000 万美元

[摘要]:Roboflow 成立于 2019 年，是 Brad Dwyer 和 Nelson 的创意，他们将计算机视觉视为一项基础技术，可以使开发人员解决因设备无法看到我们周围世界而导致的问题。该平台为开发人员提供了一个框架，可以将计算机视觉构建到他们的产品中，使他们能够上传图像和视频来训练自定义或预构建的计算机视觉模型。

02＃产品市场创新

字节跳动谢欣：把飞书打造成配得上这个时代的工具

[摘要]:因此我们进一步思考，飞书是否可以不仅仅是生产力工具，也能提升企业的组织能力。我在六年前加入字节跳动，现在负责包括飞书在内的公司 To B 企业服务。2020 年 11 月 18 日，飞书未来无限大会，字节跳动副总裁谢欣发表主题演讲，首度对外提及字节跳动做飞书的初心，以及如何打造飞书。

马德里的上下文广告平台 Seedtag 筹集了 4000 万美元

[摘要]:这轮融资中的3500 万美元通过Oakley Capital 获得，这一数字为该投资公司提供了该公司的重要少数股权。Seedtag 使用机器学习和人工智能技术，为品牌提供一系列上下文广告解决方案。预计这笔资金将进一步发展其人工智能技术，瞄准更多出版商，并扩展到美国市场。

前 InMobi 团队推出金融科技初创公司 Bright Money，融资 3100 万美元

[摘要]:金融科技初创公司 Bright Money 帮助人们做出更好的财务决策、减少债务和积累财富。这家人工智能初创公司已从红杉资本印度公司、Falcon Edge Capital 和 Hummingbird Ventures 获得 3100 万美元的资金。

一个可怕的新 AI 应用程序只需点击一下即可将女性转换为色情视频

[摘要]:从一开始，deepfakes 或 AI 生成的合成媒体主要用于创建女性的色情表现，她们经常发现这在心理上是毁灭性的。最初推广这项技术的 Reddit 创作者将女性名人的面孔转换成色情视频。时至今日，研究公司 Sensity AI 估计，所有在线 Deepfake 视频中有 90% 到 95% 是未经同意的色情内容，其中约 90% 以女性为主角。

Zoom 正在添加实时翻译服务并登陆 Facebook VR

[摘要]:在 2021 年 2 月免费提供英语实时转录/隐藏式字幕。现在 Zoom 表示，它“计划在明年年底前为（多达 30 种其他语言）提供实时转录。” 作为推动的一部分，Zoom 还将为付费帐户提供翻译服务，并计划“到明年年底支持多达 12 种语言的实时翻译。” Zoom 无法分享有关支持哪些语言以及何时支持的详细信息，但确实表示这些改进是其通过收购德国翻译公司 Kites获得的机器学习专业知识的直接结果。

深入了解 Salesforce 和 Slack Digital HQ 在 Dreamforce 2021 上宣布的创新

[摘要]:Slack 宣布了一项名为 Clips 的新产品功能，它使用户能够发送短视频消息。该公司还宣布与母公司 Salesforce 进行16 项新产品集成。Clips 功能遵循最近发布的 Huddles 的想法，专为没有正式会议或完整会议时间窗口的简短交流而设计。

Google 的研发部门尝试使用由 Google Drive 提供支持的简报

[摘要]:谷歌现在也在尝试使用时事通讯。该公司的内部研发部门 Area 120 有一个名为Museletter的新项目，它允许任何人将 Google Drive 文件作为博客或时事通讯发布到他们的 Museletter 公开资料或电子邮件列表中。

新算法可以识别阿尔茨海默病前期的大脑变化，准确率超过 99%

[摘要]:通过对 138 人的 fMRI 脑部扫描图像进行分析，新算法的准确率达到了 99% 以上。研究人员报告说，它在准确性、灵敏度和特异性方面比现有方法表现更好。特别是，该方法能够找出轻度认知障碍或 MCI 的迹象——这是认知能力下降（通常与衰老相关）和阿尔茨海默氏症之间的一步。通常，MCI 不会出现任何可以发现的身体症状。

哥伦比亚将启动耗资 2500 万美元的基于人工智能的气候建模中心

[摘要]:哥伦比亚大学校长 Lee C. Bollinger 表示：“在气候模型能够提供更精确的预测之前，在做出规划决策的区域层面，很难进行适应所需的数十亿美元的投资。我认为没有比哥伦比亚大学更好的大学，其跨学科重点，在解决气候预测问题方面处于领先地位。”

03＃监管与合规

2021年跨社交媒体的新闻消费

[摘要]:社交媒体仍然主导着新闻消费。但根据皮尤研究中心的一项新研究，这一数字正在下降：大约 48% 的美国人表示他们至少“有时”从社交媒体上获取新闻，比去年下降了 5 个百分点。而且，毫不奇怪，Facebook 和 YouTube 是主要来源。

国家税务总局：定期开展对明星艺人、网络主播的税收检查

[摘要]:《通知》提出，进一步加强文娱领域从业人员日常税收管理，对明星艺人、网络主播成立的个人工作室和企业，要辅导其依法依规建账建制，并采用查账征收方式申报纳税。

北京广电在行动:强化价值引领,引导向上向善

[摘要]:加强重要保障时期综艺节目、文艺晩会的调控管理,严禁播岀偶像养成类节目、明星孑女参加的综艺娱乐及真人秀节目,禁止未成年人参加选秀类综艺节目,避免过度娱乐化、商业化千扰主旋律主基调三是加强优秀作品供给,强化社会责任推进“中华文化广播电视传播工程”“‘民间经典故事动漫创作工程”″記记录新时代纪录片创作传播工程”,坚持扶优扶强扶原创,引导制作播出更多富有时代气息、格调积极健康、具有文化内涵的原创节目,推出《《最美中轴线》《上新了故宫》《向前一步》《生命缘》《花儿向阳童心向党—庆祝中国共产党成立100年全国少儿晚会》《北大红楼》等批叫得响、传得开的精品力作,用好作品挤压负面空间,传播正能量。

吹尽狂沙始到金——《个人信息保护法》有哪些亮点值得关注？

[摘要]:在此之外，个保法专章规定了个人在个人信息处理活动中的权利，梳理了个人信息权利的多个方面，包括个人信息收集、维护和获取三个阶段中的各项权利，具体如下图所示：其中，一些值得特别关注的亮点包括：承继行使权：已故用户的信息如何处置，是国内外网络平台近年来普遍遇到的难题之一。具体的界定标准和特殊义务如下图所示：值得注意的是，个保法第 62 条明确由国家网信部门针对小型处理者制定专门个人信息保护规则、标准的规定定，留出了立法空间。

一名程序员如何成为印度尼西亚的错误信息大师在“反乌托邦的噩梦”互联网中，伊斯梅尔·法赫米 (Ismail Fahmi) 在揭穿虚假事实方面拥有奇怪的垄断地位

[摘要]:Facebook 发言人告诉世界其他地区，在印度尼西亚，Facebook 与六个通过国际事实核查网络认证的组织合作——Kompas、Tempo、Liputan6、Tirto、MAFINDO 和法新社。标记为虚假的帖子将减少其在新闻提要中的分布，而人工智能有助于识别整个平台上几乎相同的帖子。当内容“违反 [the] 规则”时，他们会删除内容。

Telegram 成为网络犯罪分子的新暗网

[摘要]:随着IM应用程序作为暗网的替代品出现，Telegram 已成为网络犯罪分子寻求购买、出售和共享被盗数据和黑客工具的中心。

美国对向阿联酋提供黑客服务的前 NSA 员工处以罚款

[摘要]:美国司法部对三名前 NSA 员工处以罚款，他们为一家阿拉伯联合酋长国的网络安全公司担任黑客。他们利用两个iPhone漏洞，帮助阿联酋官员利用这两个漏洞来监视持不同政见者、记者和政府反对派领导人，违反了美国出口管制法。该法要求公司和个人在向以下机构提供国防相关服务之前获得国务院国防贸易管制局 (DDTC) 的特别许可。

为了不让你被骗，公安部的国家反诈中心App操碎了心

[摘要]:国家反诈中心App其实是由公安部刑事侦查局开发的一款防诈骗手机软件，正式上线于今年3月。开启这一功能需要用户授权手机的联系人、通话记录和短信等等权限，苹果和安卓手机在开启步骤上会稍有差异。此外，安卓版的反诈App还比苹果版的多出了一个“App自检”（监测手机里有没有可疑的App和安装包）功能。

AI及信息技术应用简报

AI及信息技术应用2021年9月20日简报

01＃AI应用

02＃产品市场创新

03＃监管与合规