BM120 - Sztuczna inteligencja pod własnym dachem
DataWorkshop DataWorkshop
4.69K subscribers
15,260 views
85

 Published On Premiered May 22, 2024

Zagłębiamy się w temat wytrenowania własnych modeli LLM, czyli dużych modeli językowych, pod własnym dachem.
🔔 Subskrybuj i włącz powiadomienia - Twoja droga do praktycznego ML zaczyna się od jednego kliknięcia:    / @dataworkshop  
👍 Zostaw like, bo więcej lajków = więcej praktycznych treści dla Ciebie!
💬 Co o tym myślisz? Zostaw komentarz! Masz pytanie? Zadaj je - chętnie odpowiem.
🤝 Poznajmy się lepiej! Zaproś mnie do swojej sieci na LinkedIn:   / vladimiralekseichenko  
🔊 Zainicjuj rozmowę o ML w firmie, polecając ten podcast. Zainspiruj zespół do wdrażania ML!

Partnerem podcastu jest DataWorkshop.

Gościem odcinka jest Marek Kozłowski, ekspert od NLP (Natural Language Processing) i machine learning, pracujący w AI Labie w OPI (Ośrodku Przetwarzania i Informacji, Państwowy Instytut Badawczy).

W tym odcinku rozmawiamy o:
Dlaczego trenowanie własnych modeli LLM jest tak ważne dla rozwoju Polski? Marek wyjaśnia, dlaczego własne modele LLM mogą być kluczem do rozwoju nowoczesnej gospodarki, innowacyjności i kompetencji.

Jak wygląda proces trenowania modeli LLM? Marek krok po kroku omawia poszczególne etapy uczenia, od pre-trainingu, przez fine-tuning, aż do procesu ewaluacji i walidacji.

Jakie są konkretne wyzwania i możliwości związane z budową ekosystemu modeli LLM w Polsce? Marek omawia inicjatywy takie jak konsorcjum PLLuM, a także dzieli się swoimi przemyśleniami na temat potencjału rozwoju modeli LLM w naszym kraju.

Kluczowe punkty odcinka:
LLM to coś w rodzaju nowoczesnej waluty: posiadanie własnego modelu LLM może dać przewagę konkurencyjną i wpłynąć na rozwój gospodarki i innowacyjności.
Dane to klucz: jakość i ilość danych są kluczowymi elementami determinującymi jakość modeli LLM.
Ekosystem jest ważniejszy niż pojedynczy model: budowanie ekosystemu modeli LLM, z odpowiednim zestawem danych, narzędzi i kompetencji, jest niezbędne do osiągnięcia sukcesu.

Dodatkowo:
Marek opowiada o doświadczeniach i projektach realizowanych w AI Labie w OPI, w tym o systemie antyplagiatowym JSA i modelach Qra i MMLW.
Podnosi kwestię otwartości modeli LLM i podkreśla, że kluczowe jest tworzenie modeli dostępnych dla wszystkich.



Chcesz więcej? Zajrzyj do moich kursów online i ucz się ML i analizy danych w praktyce!
👉 DS/ML od podstaw - https://dataworkshop.eu/pl/practical-...
👉 Python - https://dataworkshop.eu/pl/intro-python
👉 Statystyka - https://dataworkshop.eu/statistics
👉 SQL - https://dataworkshop.eu/pl/sql
👉 Time Series - https://dataworkshop.eu/pl/time-series
👉 NLP - https://dataworkshop.eu/pl/nlp

Spis treści:
00:00:00 - Wprowadzenie
00:03:35 - OPI i AI Lab - co to jest i czym się zajmuje?
00:10:40 - Historia deep learningu i NLP w Polsce
00:16:10 - OPI - software house I laboratoria
00:30:10 - Definicja modeli LLM
00:41:35 - Etapy uczenia modeli LLM
00:53:00 - Dlaczego warto budować modele LLM pod własnym dachem?
01:16:00 - Przyszłość AI w Polsce


🔥 Chcesz uczyć się ML/DS w DataWorkshop? Zarezerwuj indywidualną konsultację, aby doradzić najlepszą opcję dla Ciebie.
https://dataworkshop.typeform.com/to/...



🎧 Słuchaj BM wygodnie na Spotify, Apple Podcasts lub Google Podcasts:
📌 https://open.spotify.com/show/3ZUaHom...
📌 https://podcasts.apple.com/us/podcast...
📌    • Biznes Myśli  



Pamiętaj o:
Subskrybowaniu kanału!
Komentarzach i ocenie odcinka.
Udostępnieniu podcastu innym!

Do zobaczenia w kolejnym odcinku Biznes Myśli!

LinkedIn:
Marek Kozłowski:   / marek-kozłowski-phd-97a20945  
Vladimir Alekseichenko:   / vladimiralekseichenko  



Link: https://biznesmysli.pl/sztuczna-intel...
Newsletter: https://biznesmysli.pl/newsletter
AI LAB: https://opi.org.pl/laboratoria/ai-lab/

Modele:
https://huggingface.co/core42/jais-13b
https://huggingface.co/OPI-PG/Qra-13b
https://huggingface.co/speakleash/Bie...


Benchmarks:
KLEJ: https://klejbenchmark.com/leaderboard/
MTEB: https://huggingface.co/spaces/mteb/le...

#llm #nlp #ml #ai #biznes-mysli #dataworkshop

show more

Share/Embed