Podzi 目前是由 Isaac Lin 獨立開發與製作。
在疫情以前,我也曾經和幾個朋友一起經營 Podcast 頻道。那是一段很美好的時光。
錄音、上架、聊天都很開心,但剪輯音檔的過程真的非常痛苦。
(有可能是我們不夠專業,閒聊廢話太多過於鬆弛,又或者老是在做危險發言😂)
那時候我就在想,有沒有一種更舒服、更直覺的方式,
可以把 Podcast 剪輯這件事變簡單。
找了一圈,始終沒有遇到真正適合的工具。
直到 2026 年初,我開始研究本地模型與 fine-tune,
慢慢注意到語音辨識模型在多人辨識,以及中文語境裡,
其實還有很多可以進步的地方。
拿著開源社群的資料集摸索了一段時間後,
我發現語音模型的在地化,還有很大的空間能做。
於是,Podzi 誕生了。
Podzi 會專注在更好用的多軌轉譯與剪輯體驗,希望能替創作者減輕一點負擔,讓大家把時間花在真正重要的內容創作上,
在此同時我們也藉著大家的內容,優化語音辨識模型,往復正向循環,讓工具越來越好用
(一個人的聲線只會採用一兩句話作為訓練,提前徵詢你的同意,且過程完全去識別化)
這裡也讓我偷偷畫個大餅。
目前我正在替 Harness AI 與 MCP Server 鋪路中。
(如果剛好有高手看到這段,歡迎到社群平台找我交流)
未來 Podzi 不打算向創作者收取高額費用。
雖然現在算力和記憶體都還很貴,但我更希望能透過 Podzi 上的逐字稿內容,
替創作者媒合適合的廣告主。
(但這不是短時間內能輕易做到的事情就是了……除非能遇到金主爸爸 😂)
誠摯歡迎任你在使用過程中如果遇到任何問題,
可以直接與我聯繫,我們一起讓Podzi變得更好!
Isaac Lin