Спеціалізована мовна модель Generative Pre-Trained Transformer
Ключові слова:
штучний інтелект, велика мовна модель, машинне навчання, трансформер, GPT, Python
Анотація
Робота присвячена дослідженню застосування мовних моделей створених за архітектурою породжувального попередньо натренованого трансформера (GPT). Проведено дослідження архітектури GPT, процесу навчання та спеціалізації мовних моделей для вирішення конкретних задач. Досліджено можливості подальшого вдосконалення моделей та процесів тренування та спеціалізації.
Посилання
[1] Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser Ł., & Polosukhin I. Attention is All You Need // Advances in Neural Information Processing System: 31st Conference on Neural Information Processing Systems (NIPS 2017). – Long Beach, CA, USA. – 2017.
[2] Документація PyTorch [Електронний ресурс] Режим доступу: https://pytorch.org/docs/stable/index.html станом на 20.10.2024
[3] Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. Improving Language Understanding by Generative Pre-Training. OpenAI. с. 12 – 2018
[4] Вихідний код GPT-2 [Електронний ресурс] Режим доступу: https://github.com/openai/gpt-2 станом на 20.10.2024
[5] Репозиторій minGPT [Електронний ресурс] Режим доступу: https://github.com/karpathy/minGPT станом на 20.10.2024
[6] Dosovitskiy, Alexey; Beyer, Lucas; Kolesnikov, Alexander; Weissenborn, Dirk; Zhai, Xiaohua; Unterthiner, Thomas; Dehghani, Mostafa; Minderer, Matthias; Heigold, Georg; Gelly, Sylvain; Uszkoreit, Jakob. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale – 2021.
[2] Документація PyTorch [Електронний ресурс] Режим доступу: https://pytorch.org/docs/stable/index.html станом на 20.10.2024
[3] Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. Improving Language Understanding by Generative Pre-Training. OpenAI. с. 12 – 2018
[4] Вихідний код GPT-2 [Електронний ресурс] Режим доступу: https://github.com/openai/gpt-2 станом на 20.10.2024
[5] Репозиторій minGPT [Електронний ресурс] Режим доступу: https://github.com/karpathy/minGPT станом на 20.10.2024
[6] Dosovitskiy, Alexey; Beyer, Lucas; Kolesnikov, Alexander; Weissenborn, Dirk; Zhai, Xiaohua; Unterthiner, Thomas; Dehghani, Mostafa; Minderer, Matthias; Heigold, Georg; Gelly, Sylvain; Uszkoreit, Jakob. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale – 2021.
Опубліковано
2025-11-13
Як цитувати
Резь, О., Сторожук, О., & Гіссовська, Н. (2025). Спеціалізована мовна модель Generative Pre-Trained Transformer. Комп’ютерне моделювання та інформаційні технології. вилучено із https://conf.nltu.edu.ua/index.php/conf1/article/view/297
Розділ
МАТЕМАТИЧНЕ І ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

