Feature selection, česky výběr rysů, výběr příznaků nebo výběr proměnných, je postup ve strojovém učení, při kterém se z původní datové sady vybere jen část vstupních proměnných, které jsou pro daný model a úlohu skutečně užitečné. Cílem není vytvářet nové proměnné, ale ponechat z původních sloupců ty nejdůležitější a zbytek odstranit. Feature selection patří mezi...
Aktivační funkce je matematická funkce v neuronové síti, která určuje, jaký výstup pošle neuron dál. Neuron nejdříve vezme vstupy, vynásobí je vahami, přičte bias a výslednou hodnotu předá právě aktivační funkci. Ta rozhodne, jak silný signál bude pokračovat do dalších částí modelu. Bez aktivačních funkcí by neuronové sítě neuměly dobře zachycovat složité vztahy v datech...
Generativní AI, anglicky generative AI, je typ umělé inteligence, která nevypočítává jen jednu správnou odpověď nebo nerozpoznává pouze vzory v datech, ale dokáže vytvářet nový obsah. Může napsat text, navrhnout obrázek, připravit kód, shrnout dokument, přepsat e-mail, vytvořit scénář, upravit formulaci nebo pomoci s analýzou většího množství informací. Na první pohled to vypadá jednoduše: člověk...
Efekt pouhého vystavení, anglicky mere exposure effect, je psychologický jev, při kterém máme tendenci vnímat určitý podnět pozitivněji jen proto, že se s ním opakovaně setkáváme. Může jít o značku, logo, melodii, slogan, produkt, tvář, názor, reklamu nebo konkrétní styl komunikace. Čím známější nám daná věc připadá, tím menší odpor k ní často cítíme a...
Redukce dimenzionality je postup, při kterém se data s velkým počtem proměnných převedou do menšího počtu rozměrů tak, aby se zachovalo co nejvíce důležitých informací. V praxi se používá hlavně tehdy, když jsou data příliš složitá, obsahují mnoho příznaků, špatně se vizualizují nebo se s nimi modelu pracuje zbytečně obtížně. Redukce dimenzionality pomáhá data zjednodušit,...
Neuron je základní výpočetní jednotka neuronové sítě. V umělé inteligenci nejde o skutečnou nervovou buňku, ale o zjednodušený matematický model, který přijímá vstupy, přiřazuje jim různou důležitost a podle výsledku posílá informaci dál. Jeden neuron sám o sobě obvykle neumí řešit složitý problém. Důležitý začíná být až ve chvíli, kdy je propojený s mnoha dalšími...
Embedding je číselná reprezentace obsahu, kterou může model použít k porovnávání významové podobnosti. Text, obrázek, dokument nebo jiný vstup se převede na sadu čísel – vektor. Podle toho, jak jsou si tyto vektory blízké, může systém poznat, že dva texty, produkty, obrázky nebo dotazy spolu významově souvisejí, i když nepoužívají stejná slova. Na první pohled...
RAG, tedy Retrieval-Augmented Generation, je architektura umělé inteligence, která kombinuje vyhledání relevantních informací s generováním odpovědi. Model tedy neodpovídá jen podle toho, co se naučil při trénování, ale nejprve si z externích zdrojů načte potřebné podklady a teprve potom z nich vytvoří odpověď. Na první pohled může RAG působit jako obyčejné vyhledávání nad dokumenty. Uživatel...
Velký jazykový model, zkráceně LLM z anglického Large Language Model, je typ modelu umělé inteligence určený pro práci s přirozeným jazykem. Učí se ze velmi velkých objemů textových dat a díky tomu dokáže rozpoznávat jazykové vzory, pracovat s kontextem a vytvářet nový textový výstup – například odpovědi, shrnutí, parafráze, překlady nebo doplnění textu. Většina moderních...
Prompt je zadání nebo vstup, který člověk, aplikace nebo jiný systém posílá jazykovému modelu, aby podle něj vytvořil odpověď. Může jít o jednoduchou otázku, delší instrukci, úryvek dokumentu, sadu pravidel nebo kombinaci více vstupů najednou. Prompt tedy není jen „dotaz do AI“, ale celý textový rámec, ze kterého model vychází při generování výsledku. Právě proto...
Multimodální modely jsou modely umělé inteligence, které dokážou pracovat s více typy vstupů najednou – například s textem, obrázky, zvukem, videem, dokumenty, grafy nebo screenshoty. Nejde tedy jen o AI, která odpovídá na textové otázky, ale o systém, který umí propojit různé druhy informací a vyhodnotit je ve společném kontextu. Na první pohled může multimodální...
Kontextové okno je rozsah informací, se kterým může jazykový model pracovat v jednom okamžiku. Nejčastěji se vyjadřuje v počtu tokenů, tedy menších textových jednotek, ze kterých model skládá vstup i výstup. Do kontextového okna se zpravidla počítá uživatelský dotaz, předchozí relevantní části konverzace, systémové instrukce a také text, který model postupně vygeneruje v odpovědi. Pokud...
Prompt engineering je způsob, jak promyšleně formulovat zadání pro jazykový model tak, aby dával přesnější, použitelnější a věcně vhodnější výstupy. Nejde jen o „psaní lepších promptů“, ale obecně o práci se strukturou vstupu, pořadím informací, vymezením cíle, omezeními, kontextem a požadovaným formátem odpovědi. Jinými slovy – prompt engineering řeší, jak modelu zadat úkol tak, aby...
Retrieval je v kontextu umělé inteligence proces vyhledání a načtení relevantních informací, které má model použít při tvorbě odpovědi. Nejde tedy o samotné generování textu, ale o krok před ním – systém nejprve najde vhodné dokumenty, části textu, záznamy, databázové položky nebo jiné podklady a teprve potom je předá modelu jako kontext. Na první pohled...
OCR, tedy Optical Character Recognition, je technologie pro optické rozpoznávání znaků, která převádí text z obrázků, skenů, fotografií nebo PDF dokumentů do strojově čitelné podoby. Díky OCR nemusí člověk přepisovat text ručně – systém se pokusí rozpoznat písmena, čísla a další znaky přímo z obrazového podkladu a převést je na text, se kterým lze dál...
Token je základní jednotka textu nebo jiného vstupu, se kterou pracuje jazykový model. Nejde přesně o slovo, větu ani znak. Token může být celé krátké slovo, část delšího slova, interpunkční znaménko, mezera, číslo, symbol nebo jiný úsek textu podle toho, jak konkrétní model text rozděluje. Na první pohled může token působit jako drobný technický detail....
IPv6 je novější verze internetového protokolu, která slouží k adresování zařízení a serverů v síti. Jinými slovy – stejně jako starší IPv4 určuje, kam má síťový provoz skutečně směřovat, ale používá výrazně větší adresní prostor a modernější strukturu adres. Právě proto se IPv6 postupně prosazuje jako důležitá součást dnešní internetové infrastruktury. Nejde o jiný internet,...
Alias je náhradní nebo alternativní označení, které neukazuje na vlastní samostatný cíl, ale odkazuje na jiný už existující název, adresu nebo objekt. V technické praxi se s tímto pojmem člověk setká hlavně tam, kde není potřeba vytvářet novou samostatnou destinaci, ale stačí použít jiné jméno pro něco, co už existuje. Právě proto se o aliasu...
IP adresa je číselná adresa zařízení nebo serveru v síti. Právě podle ní internet pozná, kam má konkrétní požadavek skutečně doručit. Když tedy člověk zadá webovou adresu nebo když se dvě zařízení mezi sebou propojují, na pozadí se nakonec vždy pracuje právě s IP adresou. Bez ní by sice bylo možné znát název služby nebo...
AAAA záznam je DNS záznam, který přiřazuje doméně nebo hostname konkrétní IPv6 adresu. Funguje podobně jako A záznam u IPv4, jen místo staršího čtyřčlenného formátu pracuje s novější IPv6 adresou. Pokud tedy má doména nebo služba fungovat přes IPv6, právě AAAA záznam říká internetu, na jakou adresu se má připojit. Na první pohled může AAAA...