精易论坛

标题: 机读文本,本地文本转语音转文件小工具 [打印本页]

作者: 雾削木    时间: 2025-1-26 21:33
标题: 机读文本,本地文本转语音转文件小工具
wav文件信息头示例
RIFF 块(Resource Interchange File Format)
标识符:值为 52 49 46 46,对应 ASCII 码 “RIFF”,表明该文件遵循 RIFF 文件格式规范。
文件大小:值为 76 82 01 00,以小端字节序存储。转换为十进制是 0x00018276,即 98934 字节。这个大小表示整个文件除去 “RIFF” 标识符(4 字节)和文件大小字段(4 字节)后的剩余字节数。
文件类型:值为 57 41 56 45,对应 ASCII 码 “WAVE”,说明这是一个 WAVE 音频文件。
fmt 子块(Format Chunk)
子块大小:值为 12 00 00 00,以小端字节序存储,转换为十进制是 0x00000012,即 18 字节。此大小表示 fmt 子块除去子块标识符(4 字节)和子块大小字段(4 字节)后的剩余字节数。
音频格式:值为 01 00,以小端字节序存储,0x0001 表示音频格式为 PCM(Pulse - Code Modulation,脉冲编码调制)。
声道数:值为 01 00,以小端字节序存储,0x0001 表示该音频为单声道。
采样率:值为 80 3E 00 00,以小端字节序存储,转换为十进制是 0x00003E80,即 16000 Hz,表示每秒采集 16000 个样本。
字节速率:值为 00 7D 00 00,以小端字节序存储,转换为十进制是 0x00007D00,即 31744 字节 / 秒。字节速率 = 采样率 × 声道数 × 每个样本的字节数。
块对齐:值为 02 00,以小端字节序存储,0x0002 表示块对齐为 2 字节。块对齐 = 声道数 × 每个样本的字节数。
每个样本的位数:值为 10 00,以小端字节序存储,0x0010 表示每个样本的位数为 16 位。
data 子块(Data Chunk)
子块标识符:值为 64 61 74 61,对应 ASCII 码 “data”,表明接下来的数据是音频采样数据。
数据大小:值为 00 7C 01 00,以小端字节序存储,转换为十进制是 0x00017C00,即 97280 字节。这个大小表示音频数据部分的字节数。

使用本地讲述人语音库机读文本,可在讲述人语音管理中添加更多语言支持。
UP默认是Microsofr Huihui

视频观看:https://www.bilibili.com/video/BV17afzYhE6F/


成品下载:https://wwp.lanzoul.com/izHnM2m1mspg


源码下载:https://wwp.lanzoul.com/iGfqY2m1msqh

作者: bianyuan456    时间: 2025-1-30 10:36
已经顶贴,感谢您对论坛的支持!
作者: 亿万    时间: 2025-1-30 20:19
感谢分享
作者: please    时间: 2025-1-31 09:38
感谢分享,支持开源!!!
作者: please    时间: 2025-2-1 09:39
感谢分享,支持开源!!!
作者: cherryy    时间: 2025-2-1 23:22
感谢分享,支持开源!!!
作者: xjshuaishuai    时间: 2025-2-4 19:51
谢谢分享!
作者: 若然小默    时间: 2025-2-4 19:57
感谢分享
作者: kyo9766    时间: 2025-2-5 09:32
学习一下输出wav 感谢分享
作者: 老梁001    时间: 2025-2-5 23:33
声音太生硬了,有没有好听一点的声音?
作者: 我爱家人    时间: 2025-2-7 14:31
感谢分享,很给力!~
作者: 胖子葛格    时间: 2025-2-20 13:42
感谢大神分享~!
作者: 小cai鸟学    时间: 2025-2-24 09:58

感谢大神分享~!
作者: xintian    时间: 2025-2-24 21:49
我的WIN10用不了




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4