这个开源项目VLog可以将视频转化为长文档,同时支持对文档进行提问和对话,主要使用的技术包括ChatGPT、BLIP2、GRIT、Whisper和LangChain。与之前推荐的MiniGPT O类似,但实现了多模态。