Korean Bllossom ๋ชจ๋ธ์ ํ์ฉํ AI ์์ด์ ํธ ํ๋ก์ ํธ
$ git clone https://github.com/k-buildup/versatile.git
$ cd versatileWarning
llama-cpp-python ์ค์น ์ Cuda Toolkit ๋ฒ์ ์ ๋ง๋ wheel ํ์ผ์ ๋ค์ด๋ก๋ ๋ฐ์์ ์ค์นํด์ผ ํฉ๋๋ค.
$ pip install -r requirements.txt- Reference ์น์ ์ ์ฐธ๊ณ ํด์ ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํด ์ฃผ์ธ์.
modelsํด๋์ ๋ค์ด๋ก๋ ๋ฐ์ ๋ชจ๋ธ์ ๋ฃ์ด์ฃผ์ธ์.
-
agent.py์์ModelConfigํด๋์ค๋ฅผ ๋ณธ์ธ์ ์ปดํจํฐ ์ฌ์์ ๋ง๊ฒ ์์ ํด ์ฃผ์ธ์. -
.envํ์ผ์ ์์ฑํ๊ณ ๋ค์๊ณผ ๊ฐ์ด ์์ฑํด ์ฃผ์ธ์:DB_HOST=localhost DB_PORT=3306 DB_USER=root DB_PASSWORD= DB_NAME=agent_db API_HOST=0.0.0.0 API_PORT=8000 # ๋ชจ๋ธ ๊ฒฝ๋ก MODEL_PATH=./models/llama-3-Korean-Bllossom-8B/Q8_0.gguf JWT_SECRET_KEY=<your-secret-key> # ์น ๊ฒ์ TAVILY_API_KEY=<your-tavily-api-key>
# cli ํ๊ฒฝ (no-auth)
$ python cli.py
# server ํ๊ฒฝ
$ python server.py
# client.html ํ์ผ์ ์ด์ด์ฃผ์ธ์.
# ๋ฐ๋ชจ ๊ณ์ : demo, demo123quit: ์ข ๋ฃclear: ๋ํ ๊ธฐ๋ก ์ด๊ธฐํ<prompt>: Q&A@think <prompt>: ์ฌ๊ณ ๋ชจ๋@tool <prompt>: ๋๊ตฌ ๋ชจ๋
- ๋ชจ๋ธ: QuantFactory / llama-3-Korean-Bllossom-8B-GGUF (Q8_0)
- Text-to-Image
- Text-to-Video
