AI绘本读物

· 391 words · 1 minute read

讨论记录 🔗

  • 2025 年 4.6
    • 调研范围
      • 文本转语音的模型 (hugging face 上的 text-to-speek)
      • 前端图片翻页动效 (react 的库)
      • 前端音频的播放 (react 的库)
  • 后续

2025 年 4.6 🔗

文本转语音的模型 🔗

先选择轻量的模型,https://huggingface.co/hexgrad/Kokoro-82M, 参数千万级别的。

语音模型是否支持中文语音? 字节的模型应该支持中文语音 https://huggingface.co/ByteDance/MegaTTS3

模型的运行,chatgpt 描述的很简单的。


前端图片翻页动效 🔗

react-page-flip, 非常流行的 React 组件库,可以帮助你实现类似图书翻页的效果。它支持 3D 翻页动画,非常适合用于电子书、数字化杂志等项目。

react-flip-page, react-pdf 显示 PDF 文件的 React 库, flipbook.js 是一个 JavaScript 库,用于实现经典的翻页效果。


前端音频的播放 🔗

<audio> 标签将多个音频文件的播放管理放在一个数组中,通过 JavaScript 来控制每个音频段的播放

react-player 更灵活的音频控制