11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
微信近日推出三项实用新功能:一是语音/视频通话可忽略,点击弹窗左侧按钮即可静默挂断,对方不会收到拒绝提示;二是语音消息新增翻译功能,可将语音内容实时转换为所需语言,方便跨语言交流;三是视频通话新增屏幕锁定功能,点击右上角小锁图标可锁定屏幕,避免误触挂断。这些功能正逐步向用户开放,建议尝试体验。
OpenAI正研发新型双向语音模型BiDi,旨在让用户与ChatGPT的对话更自然流畅。其核心突破在于,当用户在AI发言过程中打断时,AI能实时调整回应,而非突然停止。目前ChatGPT的高级语音模式采用回合制对话机制,用户需先说完话,AI才会处理语音并生成回答。BiDi模型能持续处理说话者的语音输入,因此在被打断时可以立即调整响应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。这项技术目前仍处于开发阶段,原计划今年第一季度发布,但最新发布时间可能推迟到第二季度或更晚。
今日,一则关于iPhone通话降噪的讨论登上微博热搜,多位网友实测称开启特定功能后,即便身处嘈杂环境通话,对方也几乎听不到背景噪音。对此,苹果官方客服回应称,该功能实际为iOS15及以上系统内置的“语音突显”模式,需用户手动开启后方可生效。
Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。
支付宝5月12日上线好友语音通话功能,支持转账双方直接语音核验身份。该功能特点包括:通话过程展示对方认证真实姓名;不支持变声功能确保真实性;不保存通话内容保护隐私。用户可在隐私设置中选择是否向好友公开真实姓名,通话界面会显示昵称及"已认证"标识。功能支持麦克风和扬声器开关,可开启小窗模式查看支付记录等。通话界面除显示昵称外,还会在头像下方直接展示对方真实姓名。
微信近期对其多人通话功能进行了重要升级,用户现在可以在不创建群组的情况下,直接在双人私聊语音通话界面中邀请更多朋友加入通话。这一更新极大地简化了多人通话的流程,提升了用户体验。此次升级意味着无论是家庭聚会、朋友闲聊还是工作讨论,用户都可以更加轻松地实现多方通话,无需再经过繁琐的群组创建步骤。
多名网友在社交平台发帖反映,使用iPhone进行微信语音或视频通话时遭遇频繁中断的问题,尤其是当切换到其他应用程序时,通话会被立刻中断。出现问题的微信版本主要为8.0.53。微信官方尚未对此事做出正式回应,用户们期待问题能够得到尽快解决,以恢复正常的通讯体验。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Kimi推出多功能语音通话模式支持更换声音语速调节Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。
社交平台SoulApp语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景,并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。
腾讯宣布,腾讯主导的新一代实时语音编码行业标准AVS3P10,即将正式对外发布。由腾讯会议天籁实验室携手腾讯AILab研发的Penguins编解码器,把经典信号处理和最新的深度学习技术结合在一起,突破了传统编码器的天花板。AVS3P10标准,原型是腾讯首款神经网络语音编解码器腾讯会议PenguinsAl语音引擎,在稳定服务腾讯会议、QQ语音通话亿级用户后,开始用这项技术推动行业发展。