VibeVoice - 微软推出的文本到语音模型

作者:Jam 发布时间: August 26, 2025 分类:技术

VibeVoice 是微软推出的新型文本到语音（TTS）模型。模型能生成多达 4 位不同说话者的对话式音频，支持长达 90 分钟的连续语音输出，突破传统 TTS 系统的长度限制。VibeVoice 生成的语音富有表现力，能根据文本内容产生带有情感和语调的语音，让对话更自然生动。VibeVoice支持多种语言的语音合成，能处理跨语言对话场景，生成的语音质量高，接近人类自然语音。VibeVoice 能应用在播客制作、有声读物、虚拟助手、教育和培训、娱乐和游戏等多个领域，为相关场景提供自然流畅的语音交互体验。

>>展开阅读

非小米电脑也能玩转妙享桌面？3分钟破解小米电脑管家，互传+投屏+剪贴板全搞定

作者:Jam 发布时间: August 25, 2025 分类:技术

25096c225b2a47bf93cf6df3fc2e9853_副本.jpg

>>展开阅读

Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

作者:Jam 发布时间: August 25, 2025 分类:技术

Grok 2.5是埃隆·马斯克旗下的xAI公司开源的人工智能模型。拥有2690亿参数，基于混合专家（MoE）架构，具有强大的性能和推理能力。模型在研究生级科学知识（GPQA）、通用知识（MMLU、MMLU-Pro）和数学竞赛（MATH）等测试中表现卓越，接近当前前沿水平。Grok 2.5的文件包含42个权重文件，总容量约500GB，需要至少8个显存超过40GB的GPU才能运行。xAI建议使用SGLang语言和最新版的SGLang推理引擎来运行该模型。在逻辑推理和代码生成方面表现出色，适合用于学术研究和解决复杂问题。

>>展开阅读

iPhone 20

作者:Jam 发布时间: August 25, 2025 分类:相册

首款曲面iPhone冲上热搜：曝苹果20周年iPhone外观大改

>>展开阅读

30年前的今天：Windows 95正式发布

作者:Jam 发布时间: August 24, 2025 分类:

30年前的今天：Windows 95正式发布！首日就卖了7.2亿美元

>>展开阅读

周树人到鲁迅：一个觉醒者的精神蝶变

作者:Jam 发布时间: August 24, 2025 分类:日志

二十世纪初的中国，是一座没有光的铁屋。旧伦理的锁链尚未锈蚀，新世界的火种却已在西潮冲刷下明灭不定。在这片精神的荒原上，一个绍兴青年握住了比手术刀更锋利的事物——他以笔为炬，剖开礼教温情脉脉的肌理，在阿Q的癞疮疤里窥见国民魂灵的沉疴；他化作狂人，撕碎历史书页间密密麻麻的“吃人”二字，却终在启蒙者的悖论中咀嚼出“绝望之为虚妄，正与希望相同”的苦涩。
周树人到鲁迅：一个觉醒者的精神蝶变