Geavanceerd AI-model voor tekst en beeld
CM3leon is een geavanceerd generatief model dat zowel tekst-naar-beeld als beeld-naar-tekst generatie mogelijk maakt. Dit multimodale model combineert de functionaliteit van autoregressieve modellen met lage trainingskosten en efficiënte inferentie. Het is getraind met een innovatieve aanpak die de prestaties in tekst-naar-beeld generatie aanzienlijk verbetert, zelfs met vijf keer minder rekenkracht dan eerdere transformer-gebaseerde methoden.
Het model blinkt uit in verschillende taken, waaronder het genereren van tekst beschrijvingen voor beelden, visuele vraag-en-antwoord en tekstgebaseerde bewerking. CM3leon behaalt indrukwekkende resultaten, zoals een Fréchet Inception Distance (FID) score van 4.88, en overtreft daarmee andere modellen zoals dat van Google. Dankzij zijn veelzijdigheid en sterke prestaties is CM3leon een waardevol hulpmiddel voor diverse visie-taal taken.