作者:蔡可彼
現在已經是 2024/02/08 了,已經是小年夜了。今年比較晚寫年度回顧,因為不忍直視…..雖然其它還算順利,但還是喝了一整年,對於自己很弱的腦波感到很困擾。 2022的年度回顧在此。今
又是因為工作~ 要研究一下在進行視訊串流時,為何 player 端的 latency 會越來越長。雖然原來的問題是用 vlc 發生的,但 VLC 要建置感覺不太容易。於是想到了 ffmpeg 裡自帶的
近一年來玩的 AI 模型常常要下載很大的Python套件,若反覆下載是很浪費時間的。之前的做法是將所有使用者的 .cache 目錄共用,這樣可以減少下載的時間。另外一個做法就是像以往 http pro
建立自己的 apt 倉庫,這算是一篇很久以前我就有紀錄的文章了,不過是在 evernote 裡面。因為本質上也都 google 的到,所以就沒想說記下來了。但自從開始用 Ubuntu 20.04 以後
在以往的文章裡,已經有介紹過使用 QEMU + Buildroot 來建立 ARM64 的環境來加速開發。這個方式可以順利的建立一個小環境,來測試開發的程式。但畢竟不是一個完整的 Linux 發行版,
寫文件一直是一件很煩人的事,尤其是寫一些 API 文件。由於這類的文件的格式很固定,但又不得不寫,又常常要改來改去,弄起來總是很煩心。所以之前就想要透過自動化的方式,來產生word文件。而最近研究 A
目前的語言大模型都有搭配的 http API, 像在這篇裡提到的 Langchat-chatcat 的 API。使用上算不上複雜,但想要使用時要下的參數好像就有點多。其實要搭建自己的 LLM API,
本文參考內容,為 Youtube 上的這個影片。 使用 stable diffusion (以下稱 SD) 一直是隨便玩玩而已,可以說是邊玩邊學一點。因為至今還是沒辦法搞出什麼生產力,所以只能繼續的學
Stable Diffusion 最近出了 SDXL 1.0 版本 (以下簡稱SD),應該是畫質更好,提示詞更簡單。不過其實 Stable Diffusion 我也沒什麼在用,就是偶爾玩一下而已。最近
在前一篇利用 Azure TTS 來進行TTS後, 接著就研究反向的技術, 語音轉文字。微軟當然也有這項 API, 但語音識別有 Facebook 推出的 SeamlessM4T 模型可以做,而且效果