Wie programmier ich meine eigene mini chatbot KI?
Dazu ist Folgendes erforderlich:
1. Implementieren Sie ein großes Sprachmodell mit Transformern
2. Sammeln Sie viele Textdaten, um das Sprachmodell zu trainieren
3. Trainiere das Sprachmodell auf diesen Daten
4. Sammeln Sie Demonstrationsdaten der Eingabeaufforderungen und der gewünschten Ausgabe
5. Optimieren Sie das Modell anhand dieser Daten
6. Verwenden Sie einen Menschen, um sich die Antworten des Modells anzusehen und sie von den besten bis zu den schlechteren zu ordnen, und erstellen Sie damit einen Datensatz
7. Implementieren und trainieren Sie ein Belohnungsmodell, das Antworten einordnen kann
8. Verwenden Sie PPO und das Belohnungsmodell zusammen mit dem LLM