Published On Premiered May 22, 2024
Zagłębiamy się w temat wytrenowania własnych modeli LLM, czyli dużych modeli językowych, pod własnym dachem.
🔔 Subskrybuj i włącz powiadomienia - Twoja droga do praktycznego ML zaczyna się od jednego kliknięcia: / @dataworkshop
👍 Zostaw like, bo więcej lajków = więcej praktycznych treści dla Ciebie!
💬 Co o tym myślisz? Zostaw komentarz! Masz pytanie? Zadaj je - chętnie odpowiem.
🤝 Poznajmy się lepiej! Zaproś mnie do swojej sieci na LinkedIn: / vladimiralekseichenko
🔊 Zainicjuj rozmowę o ML w firmie, polecając ten podcast. Zainspiruj zespół do wdrażania ML!
Partnerem podcastu jest DataWorkshop.
Gościem odcinka jest Marek Kozłowski, ekspert od NLP (Natural Language Processing) i machine learning, pracujący w AI Labie w OPI (Ośrodku Przetwarzania i Informacji, Państwowy Instytut Badawczy).
W tym odcinku rozmawiamy o:
Dlaczego trenowanie własnych modeli LLM jest tak ważne dla rozwoju Polski? Marek wyjaśnia, dlaczego własne modele LLM mogą być kluczem do rozwoju nowoczesnej gospodarki, innowacyjności i kompetencji.
Jak wygląda proces trenowania modeli LLM? Marek krok po kroku omawia poszczególne etapy uczenia, od pre-trainingu, przez fine-tuning, aż do procesu ewaluacji i walidacji.
Jakie są konkretne wyzwania i możliwości związane z budową ekosystemu modeli LLM w Polsce? Marek omawia inicjatywy takie jak konsorcjum PLLuM, a także dzieli się swoimi przemyśleniami na temat potencjału rozwoju modeli LLM w naszym kraju.
Kluczowe punkty odcinka:
LLM to coś w rodzaju nowoczesnej waluty: posiadanie własnego modelu LLM może dać przewagę konkurencyjną i wpłynąć na rozwój gospodarki i innowacyjności.
Dane to klucz: jakość i ilość danych są kluczowymi elementami determinującymi jakość modeli LLM.
Ekosystem jest ważniejszy niż pojedynczy model: budowanie ekosystemu modeli LLM, z odpowiednim zestawem danych, narzędzi i kompetencji, jest niezbędne do osiągnięcia sukcesu.
Dodatkowo:
Marek opowiada o doświadczeniach i projektach realizowanych w AI Labie w OPI, w tym o systemie antyplagiatowym JSA i modelach Qra i MMLW.
Podnosi kwestię otwartości modeli LLM i podkreśla, że kluczowe jest tworzenie modeli dostępnych dla wszystkich.
Chcesz więcej? Zajrzyj do moich kursów online i ucz się ML i analizy danych w praktyce!
👉 DS/ML od podstaw - https://dataworkshop.eu/pl/practical-...
👉 Python - https://dataworkshop.eu/pl/intro-python
👉 Statystyka - https://dataworkshop.eu/statistics
👉 SQL - https://dataworkshop.eu/pl/sql
👉 Time Series - https://dataworkshop.eu/pl/time-series
👉 NLP - https://dataworkshop.eu/pl/nlp
Spis treści:
00:00:00 - Wprowadzenie
00:03:35 - OPI i AI Lab - co to jest i czym się zajmuje?
00:10:40 - Historia deep learningu i NLP w Polsce
00:16:10 - OPI - software house I laboratoria
00:30:10 - Definicja modeli LLM
00:41:35 - Etapy uczenia modeli LLM
00:53:00 - Dlaczego warto budować modele LLM pod własnym dachem?
01:16:00 - Przyszłość AI w Polsce
🔥 Chcesz uczyć się ML/DS w DataWorkshop? Zarezerwuj indywidualną konsultację, aby doradzić najlepszą opcję dla Ciebie.
https://dataworkshop.typeform.com/to/...
🎧 Słuchaj BM wygodnie na Spotify, Apple Podcasts lub Google Podcasts:
📌 https://open.spotify.com/show/3ZUaHom...
📌 https://podcasts.apple.com/us/podcast...
📌 • Biznes Myśli
Pamiętaj o:
Subskrybowaniu kanału!
Komentarzach i ocenie odcinka.
Udostępnieniu podcastu innym!
Do zobaczenia w kolejnym odcinku Biznes Myśli!
LinkedIn:
Marek Kozłowski: / marek-kozłowski-phd-97a20945
Vladimir Alekseichenko: / vladimiralekseichenko
Link: https://biznesmysli.pl/sztuczna-intel...
Newsletter: https://biznesmysli.pl/newsletter
AI LAB: https://opi.org.pl/laboratoria/ai-lab/
Modele:
https://huggingface.co/core42/jais-13b
https://huggingface.co/OPI-PG/Qra-13b
https://huggingface.co/speakleash/Bie...
Benchmarks:
KLEJ: https://klejbenchmark.com/leaderboard/
MTEB: https://huggingface.co/spaces/mteb/le...
#llm #nlp #ml #ai #biznes-mysli #dataworkshop