Falcon modely – Najvýznamnejšie open-source AI modely z UAE

Falcon je rodina veľkých jazykových modelov (LLM) vyvinutých v Spojených arabských emirátoch (UAE) v Technology Innovation Institute (TII) v Abú Zabí. Od roku 2023 sa stali jednými z najvýkonnejších open-source modelov na svete. Falcon modely vyvíja TII (Advanced Technology Research Council – ATRC). Ich cieľom je demokratizovať prístup k pokročilej AI – modely sú plne open-source, efektívne a často prekonávajú väčšie modely veľkých technologických gigantov.

Všetky modely sú dostupné na Hugging Face pod licenciou TII Falcon License (permissívna, podobná Apache 2.0 s pravidlami zodpovedného používania).

História a vývoj (2023 – 2026)

  • 2023: Falcon-7B a Falcon-40B – prvé modely, ktoré sa umiestnili na čele Hugging Face Open LLM Leaderboard. Falcon-40B bol trénovaný na 1 bilión tokenov.
  • 2024: Falcon-180B (open-access) a Falcon 2 (11B) – Falcon 2 11B prekonáva Meta Llama 3 8B a konkuruje Google Gemma 7B. Prvý multimodalny model Falcon 2 11B VLM (text + obrázky).
  • 2025: Falcon 3 – zameranie na menšie, efektívne modely s podporou viacerých modalít (text, obrázky, video, audio).
  • Január 2026: Falcon-H1 Arabic (3B, 7B, 34B) – hybridná architektúra Mamba-Transformer. Najlepší arabský LLM na Open Arabic LLM Leaderboard.
  • Január 2026: Falcon H1R 7B – kompaktný model s výnimočným uvažovaním (reasoning), prekonáva väčšie open-source modely.
  • Február – marec 2026: Falcon-H1-Tiny séria (15 ultra-malých modelov, napr. 0.6B) – určené pre edge AI a podnikové nasadenie.
  • Marec/apríl 2026: Falcon Perception a Falcon OCR – nové vizuálne modely (multimodálne). Falcon Perception prekonáva Meta SAM 3 v segmentácii obrázkov.

Kľúčové inovácie Falcon modelov

  • Hybridná architektúra – kombinácia Transformer + Mamba (State Space Models) pre lepšiu efektivitu a dlhý kontext.
  • Vysoká efektivita – menšie modely (7B, 11B) dosahujú výkon väčších modelov (70B+) pri nižšej spotrebe energie a pamäte.
  • Multimodalita – podpora textu, obrázkov, videa a audio (najnovšie verzie Falcon 3 a Perception).
  • Arabský jazyk – Falcon-H1 Arabic je momentálne najlepší otvorený arabský model (podporuje dialekty, matematiku a dlhý kontext).
  • Open-source prístup – všetky modely vrátane datasetu REFINEDWEB sú voľne dostupné.

Najnovšie modely (stav k aprílu 2026)

Model Veľkosť Hlavné prednosti
Falcon-H1 Arabic 3B / 7B / 34B Najlepší arabský LLM, hybrid Mamba-Transformer
Falcon H1R 7B 7B Výnimočné uvažovanie (reasoning), nízka spotreba
Falcon-H1-Tiny 0.6B a ďalšie (15 modelov) Edge AI, chat, kódovanie, agentické úlohy
Falcon Perception + OCR Videnie + čítanie textu z obrázkov, prekonáva SAM 3
Falcon Mamba 7B 7B Prvý open-source State Space Language Model

Falcon modely ukazujú, že UAE sa nestáva len spotrebiteľom AI, ale aj jej výrobcom. TII úspešne vytvára modely, ktoré sú menšie, efektívnejšie a otvorené, pričom často prekonávajú modely veľkých firiem ako Meta, Google alebo Alibaba – najmä v arabskom jazyku a v efektivite.

Vďaka otvorenosti môžu vývojári, univerzity aj firmy na celom svete (vrátane Slovenska) tieto modely voľne používať, upravovať a nasadzovať. Falcon tak pomáha democratizovať AI a znižovať závislosť od uzavretých amerických alebo čínskych modelov.


Čurillovci - Policajti v prvej línii boja s mafiou - Marek Vagovič

Čurillovci - Policajti v prvej línii boja s mafiou - Marek Vagovič

Do not believe *anything* until the Kremlin denies it™