Podcastfy 是一个开源 Python 包,它使用 GenAI 将多模式内容(文本、图像)转换为引人入胜的多语言音频对话。输入内容包括网站、PDF、图像、YouTube 视频以及用户提供的主题。
与主要关注研究综合的基于闭源 UI 的工具(例如 NotebookLM ❤️)不同,Podcastfy 专注于从众多多模式来源生成开源、程序化和定制的引人入胜的对话内容,从而实现定制和扩展。
项目介绍
Podcastfy 是一款强大的开源 Python 工具,能将网页、PDF、图片等多模态内容智能转换为多语言播客对话。
它堪称 Google NotebookLM 播客功能 的开源替代方案,让你轻松生成引人入胜的播客内容。
快速入门 💻
先决条件
- Python 3.11 或更高版本
$ pip install ffmpeg
(用于音频处理)
设置
- 从 PyPI 安装
$ pip install podcastfy
- 设置您的API 密钥
Python
from podcastfy.client import generate_podcast audio_file = generate_podcast(urls=["<url1>", "<url2>"])
命令行界面
python -m podcastfy.client --url <url1> --url <url2>
特点✨
- 从多种来源和格式(图像、文本、网站、YouTube 和 PDF)生成对话内容。
- 制作短篇(2-5 分钟)或长篇(30 分钟以上)播客。
- 定制成绩单和音频生成(例如,风格、语言、结构)。
- 使用 100 多个 LLM 模型(OpenAI、Anthropic、Google 等)生成成绩单。
- 利用本地 LLM 生成成绩单以增强隐私和控制力。
- 与先进的文本转语音模型(OpenAI、Google、ElevenLabs 和 Microsoft Edge)集成。
- 为全球内容创作提供多语言支持。
- 与 CLI 和 Python 包无缝集成,实现自动化工作流程。
项目地址
https://github.com/souzatharsis/podcastfy
原创文章,作者:北单,如若转载,请注明出处:https://www.beidanyezhu.com/a/226.html