摸鱼 发现创造 Rules & Tips
1. 遵守中国大陆相关法律法规
2. 推崇「哥伦布式」的发现
3. 创造不是复制粘贴,是自我表达

尝试独立开发做副业,做了一个讲座视频转图文的 AI 工具 ReadLecture,目前在内测中,大家可以来玩玩

查看: 2655|回复: 10
1
wildwind0 发表于 2024-6-3 23:45:23
其实最开始是为了解决自己的一个需求,因为我自己本身从事大模型算法相关的工作,接触到许多前沿科技的信息。平时我会观看国外的公开课和论坛上大佬的分享会。现在很多人会邀请学术界和工业界的大佬在论坛大会上分享,他们通常会使用PPT讲解技术和产品,每个视频通常持续一两个小时。要完整观看这些视频非常耗时,很难抽出整块时间。我在B站的学习文件夹中已经存放了一两百个这样的视频,但很多都未曾观看。我认为阅读文字对我来说更方便,因为平时阅读书籍、公众号和博客都很快,可以利用零碎时间,并且文字和图片便于整理笔记和知识库。作为一个知识博主,我平时会撰写文章并发布,视频内容是我重要的素材来源。因此,我决定将视频内容制作成图文结合的文档保存,以便于自己查看和创作时使用。基于这个想法,我花了一两天时间编写了一个Python脚本。

现在大模型和人工智能技术发展迅速,这个功能很简单,使用CV模型提取PPT内容,再利用Whisper模型将音频转录成文字,这样就能完成大部分工作,包括文字和图片的处理。之后,可以利用大模型进行总结,形成一个优质的素材,用于阅读或创作。

我最近做了场直播,分享独立开发的经历,有兴趣的朋友可以看看:独立开发新路历程

然后除了做工具外,我也把工具产出的图文笔记发在了公众号ReadLecture上,由兴趣的朋友可以关注,并且加入内测免费试用。

放几个转换好的图文样例:

1. 【PPT+讲稿+笔记】张俊林:多模态大模型:系统、趋势与问题

2. 【PPT+文字稿+笔记】清华大学靳卫萍:房产新政四箭齐发|当前宏观经济形势与热点分析

ReadLecturexuanchua.png
飓风861 发表于 2024-6-4 09:06:40
厉害了
布拉格 发表于 2024-6-4 09:05:01
哈哈,说起来有点搞笑,都知道文字的信息输出和输入效率最高,但现在短视频时代,搞得信息传播也走向下沉,很多人已经文字阅读困难了,特别是长文,可能都看不下去 🤣 兜兜转转,AI 又创造了视频信息的文字总结功能,爱刷视频和喜读文字的都有了舒适区,挺好的。
kowalski 发表于 2024-6-4 09:15:16
挺好挺好,视频没时间看,文字可以碎片化阅读。
申请试用!
ww2271529 发表于 2024-6-4 10:19:28
申请试用,谢谢。
 楼主| wildwind0 发表于 2024-6-4 12:59:14
布拉格 发表于 2024-6-4 09:05
哈哈,说起来有点搞笑,都知道文字的信息输出和输入效率最高,但现在短视频时代,搞得信息传播也走向下沉, ...

哈哈 阅读是不能被视频替代的我觉得 自己沉浸式阅读 才能真正学进去
 楼主| wildwind0 发表于 2024-6-4 12:59:48
kowalski 发表于 2024-6-4 09:15
挺好挺好,视频没时间看,文字可以碎片化阅读。
申请试用!

欢迎欢迎 扫图片里面的二维码就行
 楼主| wildwind0 发表于 2024-6-4 12:59:59
ww2271529 发表于 2024-6-4 10:19
申请试用,谢谢。

欢迎欢迎 扫图片里面的二维码就行
xyy 发表于 2024-6-4 17:09:16
好牛
wayhome 发表于 2024-6-4 23:44:47
百度网盘会员直接就有这个功能了
 楼主| wildwind0 发表于 2024-6-18 00:12:44
wayhome 发表于 2024-6-4 23:44
百度网盘会员直接就有这个功能了

没我的效果好 hhh
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-5-2 06:07

快速回复 返回顶部 返回列表