讨论记录 🔗
- 2025 年 4.6
- 调研范围
- 文本转语音的模型 (hugging face 上的 text-to-speek)
- 前端图片翻页动效 (react 的库)
- 前端音频的播放 (react 的库)
- 调研范围
- 后续
2025 年 4.6 🔗
文本转语音的模型 🔗
先选择轻量的模型,https://huggingface.co/hexgrad/Kokoro-82M, 参数千万级别的。
语音模型是否支持中文语音? 字节的模型应该支持中文语音 https://huggingface.co/ByteDance/MegaTTS3
模型的运行,chatgpt 描述的很简单的。
前端图片翻页动效 🔗
react-page-flip, 非常流行的 React 组件库,可以帮助你实现类似图书翻页的效果。它支持 3D 翻页动画,非常适合用于电子书、数字化杂志等项目。
react-flip-page, react-pdf 显示 PDF 文件的 React 库, flipbook.js 是一个 JavaScript 库,用于实现经典的翻页效果。
前端音频的播放 🔗
<audio> 标签将多个音频文件的播放管理放在一个数组中,通过 JavaScript 来控制每个音频段的播放
react-player 更灵活的音频控制