Rozmowa z Piotrem Rybakiem - NLP researcherem w PAN w Instytucie Podstaw Informatyki
Rozmawiamy min.:
- najlepszych praktykach w budowaniu systemów typu "Retrieval"
- jak trenować modele do tworzenia embeddingów
- o budowie datasetów, tłumaczeniu angielskich i scrapowaniu
- o tym czy LLMy mogą ukrywać przed nami swoją świadomość
- czy proste rzeczy są naprawdę proste i czy są łatwe do zrozumienia
- o różnicach w wiedzy na temat polskich i angielskich QnA
- modelach Silver Retriever,
- datasetach MAUPQA i POLQA
- aplikacji do rozpoznawania klocków LEGO
Przydatne linki:
Papers with code:
https://paperswithcode.com/search?q=author%3APiotr+Rybak
model Silver Retriever
https://huggingface.co/ipipan/silver-retriever-base-v1
datasety Polqa i Maupqa
https://huggingface.co/datasets/ipipan/polqa
https://huggingface.co/datasets/ipipan/maupqa
Aplikacja do rozpoznawania klocków LEGO:
https://brickognize.com/
Książka " Jak zacząć podcast " - poradnik dla osób, które chcą zacząć podcastować
Napisz do mnie:
Michal Dulemba | LinkedIn
Subskrybuj podcast:
Apple Podcasts
Spotify
Google Podcasts
Podcast Addict
RSS
Korzystam z:
Buzzsprout (hosting odcinków):
https://www.buzzsprout.com/?referrer_id=1783532
Riverside (aplikacja do zdalnego nagrywania):
https://www.riverside.fm/?via=dulemba
Jest to odcinek podkastu:
Nieliniowy
Podcast Nieliniowy to miejsce, gdzie poruszam takie tematy jak sztuczna inteligencja (artificial intelligence / AI), uczenie maszynowe (machine learning / ML) oraz analityka danych (data science / data analytics). Moich gości pytam też o biznes, naukę i etykę / odpowiedzialność w branży ML. Zapraszam serdecznie
Technologia