向奕鸣:专注阳宅风水与墓地风水堪舆!

OpenAI宣布开源多语言语音识别系统Whisper

来源:向奕鸣

,语音识别仍是一个颇具挑战性的话题。好消息是,今日 OpenAI 隆重地宣布了 Whisper 的开源 —— 可知作为一套自动语音识别系统,官方宣称它能够实现多种语言的强大转录、并将它们翻译

OpenAI宣布开源多语言语音识别系统Whisper

尽管包括 Google、亚马逊和 Meta 在内的科技巨头,都将各自开发的功能强大的语音识别系统置于其软件和服务的核心地位。但在人工智能和机器学习领域,语音识别仍是一个颇具挑战性的话题。好消息是,今日 OpenAI 隆重地宣布了 Whisper 的开源 —— 可知作为一套自动语音识别系统,官方宣称它能够实现多种语言的强大转录、并将它们翻译成英语。

OpenAI 表示,Whisper 的不同之处,在于其接受了从网络收集的 68 万小时的多语言和“多任务”训练数据,从而提升了该方案对独特口音、背景噪声和技术术语的识别能力。

官方 GitHub 存储库上的概述称:

Whisper 模型的主要目标用户,是研究当前模型稳健性、泛化、能力、偏差和约束的 AI 研究人员。

与此同时,它也很适合作为面向开发者的自动语音识别解决方案尤其是英语语音识别。

感兴趣的朋友,可以从托管平台上下载 Whisper 系统的多个版本,其模型在大约 10 种语言上展现出了强大的 ASR 结果。

此外假如在某些任务上加以微调的话,它们还有望在语音活动检测、讲述者分类等应用场景下表现出额外的能力。

架构示意

遗憾的是,Whisper 尚未在相关领域得到强有力的评估、且模型也有其局限性 —— 有其在文本预测领域。

由于该系统接受了大量“嘈杂”的数据训练,OpenAI 决定提前给大家打一剂预防针,警告称 Whisper 可能在转录中包含实际上未讲述的单词。

原因可能是 Whisper 既试图预测音频中的下一个单词、又试图转录音频本身。

流程示例

此外 Whisper 在不同语言场景下的表现也不大一致,尤其涉及在训练数据中没有很好被代表的语言的讲述者时,其错误率也会更高。

不过后者在语音识别领域早已不是什么新鲜事,即使业内首屈一指的系统,也一直受到此类偏差的困扰。

参考斯坦福大学在 2020 年分享的一项研究结果 —— 相较于黑人,来自亚马逊、苹果、Google、IBM 和微软的系统,针对白人用户的错误率要低得多(大约 35%)。

Whisper 有约 1/3 的音频数据集为非英语

即便如此,OpenAI 还是认为 Whisper 的转录功能,可被用于改进现有的可访问性工具。其在 GitHub 上写道:

尽管 Whisper 模型不适用于开箱即用的实时转录,但其速度和大小表明,其他人可在此基础上构建近乎实时的语音识别和翻译应用程序。

建立在 Whisper 模型之上的有益应用程序,其价值切实地表明了这些模型的不同性能,有望发挥出真正的经济影响力。

我们希望大家能够将该技术积极应用于有益目的,使自动语音识别技术更易获得改进、让更多参与者能够打造出更负责任的项目。

在速度和准确性的双重优势下,Whisper 将允许对大量通信提供可负担得起的自动转录和翻译体验。

(举报)

【腾讯云】11.11云上盛惠提前享-云服务器2核2G每月仅4元

腾讯云双十一活动来了,云服务器多种机型限时抢购,爆品提前购 同价11.11。专业技术7*24小时在线服务,腾讯云为企业和个人提供快捷,安全,稳定的云服务!

OpenAI 开放图像生成人工智能系统 DALL-E2 作为 API 使用

在2022-11-04 的一篇博客文章中,OpenAI宣布,任何开发者一旦创建了OpenAI API账户参与公开测试,就可以开始利用DALL-E2的功能。DALL-E2API的定价因分辨率而异。对于1024×1024的图像,费用为每张0.02美元;512×512的图像为每张0.018美元;而256×256的图像为每张0.016美元。与OpenAI的企业团队合作的公司可以获得批量折扣。

微软正在对 OpenAI 人工智能新一轮投资进行谈判

​微软于 2019 年对 OpenAI 投资了 10 亿美元。这名知情人士说,双方目前尚未达成协议,投资金额也可能随着谈判进展而发生变化。知情人士说,这两家公司在最近几周进行了谈判。

WhatsApp服务在全球多地发生故障 Meta:正在抢修

据国外媒体报道,Meta Platforms旗下社交通讯软件WhatsApp在全球多地的服务出现故障,亚洲、英国、南非和欧洲都有用户报告了无法发送和接收信息的问题...据网络追踪网站Downdetector.com显示,英国有超过6.8万名用户报告了这一问题,印度、新加坡和南非分别有1.5万、1.9万和1.5万人报告故障...# whatsappdown话题已冲上推特热搜,已发布相关推文7万条...

Telegram创始人称WhatsApp是被植入了后门的“监视工具”

但竞争对手Telegram的创始人认为人们应该远离Meta的产品,他称其是一个不断存在安全问题的监视工具...Durov指的是上周在WhatsApp中发现的两个安全问题,这些问题可能允许在特定设备上远程执行代码...他指出,在2017年、2018年、2019年和2020年都发现了跟最近的补丁相同的安全问题...Durov指出,这些安全问题不是偶然的,而是被植入了后门,每当发现和删除以前的后门就会增加一个新的后门...他还称在2021年抨击过苹果,称其销售来自“中世纪”的“价格过高、过时的硬件”......

扎克伯格嘲讽苹果iMessage不安全:不如自家WhatsApp

MetaCEO马克扎克伯格发布了一则火药味十足的广告,直指苹果iMessage...Meta在美国纽约市地铁的宾夕法尼亚车站发布了一则图片广告,广告嘲讽了iMessage不支持跨平台加密,和苹果的移动聊天工具和传统的手机短信服务相比,Meta旗下社交软件WhatsApp更加安全也更有私密性...资料显示,2014年2月,Facebook正式宣布收购WhatsApp,收购金额高达190亿美金,其中Facebook将为交易支付40亿美元现金,剩下的将用价值120亿美元的股票换取......

扎克伯格:WhatsApp 比苹果 iMessage 更私密、更安全

:​Meta首席执行官马克-扎克伯格在Instagram的一篇新贴文中称,WhatsApp比苹果的iMessage平台「更私密、更安全」。扎克伯格在分享纽约市的Meta广告牌时说,由于WhatsApp具有端到端加密功能,可以设置信息在设定的时间段后消失,而且可以在多个平台上使用,因此对关注隐私的用户来说要好得多。

到底都有哪些国产的开源操作系统?

老有人说国产的操作系统比用户都多,这里给各位老哥盘点一下国产的开源操作系统,包括但不限于服务器操作系统、桌面操作系统、物联网及边缘操作系统、嵌入操作系统式......OpenCloudOS 是由腾讯等20余家操作系统、云平台、软硬件厂商与个人共同倡议发起的操作系统社区项目,目标是打造全面中立、开放、安全、稳定易用、高性能的 Linux 服务器操作系统,共建国产操作系统开源技术社区,扩大社区发行版影响力,构建操作系统健康繁荣的生态......

消息称微软正与人工智能公司OpenAI就新一轮融资进行深入谈判

据国外媒体报道,据一位知情人士透露,微软正与人工智能公司OpenAI就新一轮融资进行深入谈判...OpenAI成立于2015年,由特斯拉首席执行官(CEO)埃隆•马斯克(Elon Musk)和其他富有的硅谷企业家联合建立,是一家专注于人工智能的公司...去年,OpenAI现有股东曾向红杉资本、老虎全球管理公司、Bedrock Capital和安德森•霍洛维茨等投资者出售了OpenAI的股票,但此事未披露...

YCloud与WhatsApp达成合作 助力出海企业驱动商业增长

自此,YCloud将提供两种服务模式:易于开发者集成的API,以及封装了WhatsApp商业消息的验证/营销解决方案,助力出海企业精准触达全球消费者,驱动商业增长...启用WhatsApp Business Platform需要与Meta的商业解决方案服务商合作,出海企业无法单独申请...如今通过与WhatsApp合作,进一步完善了全渠道消息解决方案,帮助出海企业在全球范围内扩展业务版图,助力更多出海企业扬帆起航,逐鹿全球......

强强联手 国产龙芯支持鸿蒙开源系统

中关村在线消息:龙芯中科宣布,在龙芯中科与润和软件共同努力下,OpenHarmony操作系统与龙芯2K0500开发板完成适配验证,龙架构平台对于OpenHarmony已形成初步支持...片内集成64位LA264处理器核、32位DDR3控制器、2DGPU、DVO显示接口、两路PCIe2.0、两路SATA2.0、四路USB2.0、一路USB3.0、两路GMAC、PCI总线、彩色黑白打印接口、HDA及其他常用接口...

锐龙R7 5800X3D支持AVX2吗?

支持。锐龙7 5800X3D上提供硬件虚拟化,大大提升了虚拟机性能。使用高级矢量扩展 (AVX) 的程序可以在此处理器上运行,从而提高计算量大的应用程序的性能。除了 AVX,AMD 还包括更新的 AVX2 标准,但不包括 AVX-512。

华为 Pocket S可以防水吗?

防水性能一般华为 Pocket S防水级别是IP53级别。华为 Pocket S并非专业防水手机,在正常使用状态下可防溅、抗水、防尘,在受控实验室条件下经测试,其效果在 GB/T 4208-2017(国内)/ IEC 60529(海外)标准下达到 IP53 级别。 防溅、抗水、防尘功能并非永久有效,防护性能可能会因日常磨损而下降。请勿在潮湿状态下为手机充电。

锐龙R7 5800X3D支持PICE5.0吗?

不支持。锐龙R7 5800X3D只支持PICE4.0。总共有 24 个 PCIe Gen4 通道。24 个通道中有 4 个用于与主板芯片组的互连,剩下 20 个通道 Gen 4.0 用于其他用途。16 通道 (PCIe x16) 用于连接为 x16 或两个 x8 的图形卡。从 Gen 3.0 来看,Gen 4.0 x8 链路将提供类似于 PCIe 3.0 x16 的带宽。CPU 的另外四个 PCIe 通道专为快速存储而设计,例如与 PCIe 4.0 NVMe 兼容的 SSD。

华为 Pocket S支持哪些拍照模式?

微电影、高像素模式、延时摄影等华为 Pocket S后置拍摄功能:微电影、高像素模式、延时摄影、超大广角、大光圈虚化、双景录像、超级夜景、超级微距、微距视频、微距画中画、人像模式、专业模式、慢动作、全景模式、黑白艺术、智能滤镜、水印、文档矫正、AI摄影大师、动态照片、熄屏快拍、4D预测追焦、笑脸抓拍、声控拍照、定时拍照、连拍、快拍;前置拍摄功能:慢动作、智能广角切换、人像模式、全景模式、延时摄影、动态照片、智能滤镜、水印、笑脸抓拍、自拍镜像、声控拍照、定时拍照。

锐龙R7 5800X3D支持ECC内存吗?

支持。锐龙R7-5800X3D是支持ECC内存的,这是任务关键型系统的一项重要功能,可避免数据损坏。在内存中ECC能够容许错误,并可以将错误更正,使系统得以持续正常的操作,不致因错误而中断,且ECC具有自动更正的能力,可以将Parity无法检查出来的错误位查出并将错误修正。一些厂商推出的入门级低端服务器使用的多是普通PC用的SDRAM,不带ECC功能,在选购时应该注意这个指标。

华为 Pocket S有光学防抖吗?

没有华为 Pocket S后置镜头在视频拍摄的时候最大支持4K(3840x2160)视频录制,支持AIS防抖; 前置摄像头视频拍摄 最大支持4K(3840 x 2160)视频录制,支持AIS防抖;这款手机没有光学防抖功能,因此有一些运动状态拍摄视频或照片时稳定性不是非常出色,当然它定位的就不是拍照手机。

锐龙R7 5800X3D是多少线程?

16线程。锐龙R7-5800X3D是16线程的处理器。线程(英语:thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。在Unix System V及SunOS中也被称为轻量进程(lightweight processes),但轻量进程更多指内核线程(kernel thread),而把用户线程(user thread)称为线程。

华为 Pocket S是DC调光方式吗?

不是华为 Pocket S使用的是PWM调光,其中内屏是OLED,最高支持120Hz刷新率,1440Hz高频PWM调光,300Hz触控采样率;外屏是OLED,最高支持60Hz刷新率,120Hz触控采样率。

锐龙R7 5800X3D是什么针脚接口类型?

AM4。锐龙R7 5800X3D是一款 8 核台式机处理器,于 2022 年 4 月推出。它是 Ryzen 7 系列的一部分,采用 Zen 3 (Vermeer) 架构和 Socket AM4。AMD AM4 平台灵活主板 DDR4 内存、PCIe® 4.0 NVMe 显示和显卡,并且在芯片组类别排列超支持高速 USB 10Gbps 接口。 AM4 平台实现了直连 SATA 和 USB,可根据实际需求配置,再能够为游戏玩家和创意人士带来所需的功能。

华为 Pocket S外屏有哪些功能?

外屏卡片、外屏主题、自拍显示等华为 Pocket S的外屏可以用来显示卡片、主题以及在自拍的时候用来显示拍照画面等功能,此外还可以显示时间、未接电话等一些基本通信信息,可以说很多情况下不需要打开折叠屏就可以看到一些重要的通知短消息等。华为 Pocket S使用了一块1. 04 英寸OLED屏幕,分辨率340 x340 像素,最高支持60Hz刷新率,120Hz触控采样率。

锐龙R7 5800X3D是台积电还是三星代工?

台积电。锐龙R7 5800X3D硅芯片不是在 AMD 制造的,而是在台积电的代工厂制造的。AMD 与 TSMC 开发的 3D 堆叠工艺的另一个主要优势是绑定了这个额外的缓存小芯片(在新标签中打开)处理核心和 L3 缓存使其占用空间足够小,以使所有这些都适合与 Ryzen 5800X 相同的封装。

华为 Pocket S处理器性能怎样?

高通骁龙778G 4G华为 Pocket S处理器型号是高通骁龙778G 4G,采用台积电6nm工艺,集成八核心CPU,包括一个大核A78 2.4GHz、三个中核A78 2.2 GHz、四个小核A55 1.9GHz,同时集成Adreno 642L GPU。该处理器安兔兔跑分大约是52万分,CPU成绩 159545 分、GPU成绩 157046 分、UX成绩84097、MEM成绩则是125216,这个数据属于中端处理器的水平。

锐龙R7 5800X3D是什么架构?

Zen3架构。AMD 锐龙R7-5800X3D 的底层 Zen3架构与八核16线程AMD Ryzen7-5800X 相同,此外Ryzen75800X3D 的不同之处在于引入了 AMD 新的3D 堆叠缓存,称为3D V-Cache。这个额外的裸片与5800X 的底层核心复合裸片 (CCD) 结合在一起(尽管裸片本身已经被化学刮掉,以便为新的高速缓存裸片腾出空间)。

锐龙R7 5800X3D的3D V-Cache有什么用?

有以下功能。AMD3D V-Cache是适用于服务器和桌面应用程序的创新3D 堆叠封装技术。为7nm x86-64CPU 实现 Hybrid-Bonded64MB 堆叠缓存,这是一种不同的处理器布局方式,并且由于 CPU 制造商在芯片上放置组件的方式取得了进步,AMD 能够在不制造大型 CPU 的情况下压缩更多缓存。AMD 仅在游戏领域构建了额外的缓存,AMD表示它可以提供平均15% 的改进。更多的 L3缓存允许处理器流式传输和存储更多指令,从而减少从 RAM 中提取指令所需的次数。自然,这并不能在所有情况下都提供性能优势。但是,在 CPU 处理多条指令的情况下,例如游戏,额外的 L3缓存应该会提供很大的提升。

锐龙R7 5800X3D价格多少钱?

2999元。2022年4月20日,AMD 宣布 R75800X3D 游戏处理器上市,售价3099元。AMD R75800X3D,是AMD旗下处理器(CPU)。采用7nm工艺,8核16线程,3.4-4.5GHz,三级缓存达到了96MB,默认功耗为105W。

华为 Pocket S电池多大?

4000mAh华为 Pocket S电池容量是4000mAh,手机支持最大10V/4A华为超级快充,兼容10V/2.25A或4.5V/5A或5V/4.5A或9V/2A或5V/2A充电器,数据接口为USB Type-C,USB 2.0。考虑到这款手机是折叠屏,因此在内部电池上市两块电池的设计,比同尺寸的直板手机电池小一些,但已经可以满足一天的基本使用。

华为 Pocket S机身尺寸多大?

展开态:170mm(长)*75.5mm(宽)*7.2mm(厚)华为 Pocket S机身尺寸为展开态:170mm(长)*75.5mm(宽)*7.2mm(厚);折叠态:87.3mm(长)*75.5mm(宽)*15.2mm(厚),机身重量约 190 克(含电池)。

华为 Pocket S充电速度多少W?

40W华为 Pocket S支持最大10V/4A华为超级快充,兼容10V/2.25A或4.5V/5A或5V/4.5A或9V/2A或5V/2A充电器。最大支持40W华为超级快充(仅支持有线充电),需搭配40W华为超级快充充电套装使用。

华为 Pocket S屏幕参数怎么样?

内屏6.9英寸,外屏1.04英寸,内屏最高支持120Hz刷新率华为 Pocket S内屏是6. 9 英寸OLED屏幕、10. 7 亿色,分辨率FHD+,2790 x1188 像素,最高支持120Hz刷新率,1440Hz高频PWM调光,300Hz触控采样率,442 ppi;外屏是1. 04 英寸OLED屏幕, 1670 万色,分辨率340 x340 像素,最高支持60Hz刷新率,120Hz触控采样率,328 ppi。

华为 Pocket S摄像头参数怎么样?

后置双摄,4000 万像素超感知摄像头+1300 万像素超广角摄像头华为 Pocket S后置双摄镜头,分别是4000 万像素超感知摄像头(f/1. 8 光圈)+1300 万像素超广角摄像头(f/2. 2 光圈),前置1070 万像素超广角摄像头,f/2. 2 光圈。后置摄像头视频拍摄 最大支持4K(3840x2160)视频录制,支持AIS防抖; 前置摄像头视频拍摄 最大支持4K(3840 x 2160)视频录制,支持AIS防抖。

本文由向奕鸣整理发布,转载请注明出自http://www.xjfsg.com/news/39412.shtml

上一篇:大连治疗性病医院下一篇:OpenAI宣布开源多语言语音识别系统Whisper

相关文章

图文资讯

友情链接: 向奕鸣