Kas yra Midjourney ir kodėl visi apie tai kalba?
Jei pastaruosius metus praleidi socialiniuose tinkluose ar bet kurioje kūrybinėje bendruomenėje, tikriausiai matei tuos nuostabius, beveik fotorealistinius paveikslus, kuriuos žmonės generuoja per kelias sekundes. Didelė dalis jų – Midjourney darbas. Tai dirbtinio intelekto įrankis, kuris iš paprastų tekstinių aprašymų kuria vaizdus, ir šiuo metu jis laikomas vienu geriausių savo srityje.
Midjourney nėra programa, kurią įsidiegtum į kompiuterį. Ji veikia per Discord platformą – ir tai iš pradžių gali atrodyti keistai, bet greitai pripranti. Kompanija įkurta 2021 metais, o plačiajai visuomenei prieinama tapo 2022-aisiais. Nuo tada ji nuolat tobulinama – šiuo metu galima naudoti jau šeštą versiją (v6), kuri sugeba kurti vaizdus, nuo kurių kartais sunku atskirti, ar tai fotografija, ar generuotas turinys.
Kodėl verta išmokti naudotis būtent šiuo įrankiu? Nes jis keičia žaidimo taisykles dizaineriams, marketingo specialistams, rašytojams, žaidimų kūrėjams ir tiesiog žmonėms, kurie nori realizuoti savo vizijas be metų mokymosi piešti ar fotografuoti. Lietuvoje šis įrankis dar nėra labai plačiai žinomas, tad dabar – puikus metas įšokti į traukinį, kol jis dar nepasiekė galutinės stotelės.
Kaip pradėti: paskyros kūrimas ir Discord sąranka
Pirmiausia reikia turėti Discord paskyrą. Jei jos neturi – eik į discord.com ir susikurk. Tai nemokama, užtrunka apie dvi minutes. Discord yra pokalbių platforma, panaši į Slack ar Microsoft Teams, tik labiau orientuota į bendruomenes ir žaidėjus.
Kai Discord paskyra paruošta, eik į midjourney.com ir spausk „Join the Beta”. Tai nukreips tave į oficialų Midjourney Discord serverį. Čia rasite šimtus kanalų, bet pradedantiesiems svarbiausi yra #newbies kanalai – jų yra keli (newbies-1, newbies-2 ir t.t.), ir juose galima rašyti komandas bei gauti pirmuosius rezultatus.
Svarbu žinoti: Midjourney nėra nemokamas įrankis. Anksčiau buvo galima gauti kelis nemokamus bandymus, bet dabar reikia mokėti. Planai atrodo taip:
- Basic plan – apie 10 USD per mėnesį, gauni apie 200 paveikslų per mėnesį
- Standard plan – apie 30 USD per mėnesį, neriboti „relax” režimo generavimai
- Pro plan – apie 60 USD per mėnesį, greičiau, daugiau galimybių, privatus režimas
Pradedantiesiems Basic planas visiškai pakanka. Jei suprasi, kad naudoji įrankį kasdien ir rimtai, galima vėliau atnaujinti. Prenumeratą aktyvuoji rašydamas komandą /subscribe bet kuriame Midjourney kanale.
Pirmasis prompt: kaip kalbėtis su dirbtiniu intelektu
Čia prasideda tikrasis žaidimas. Midjourney supranta komandas anglų kalba (lietuviškai taip pat galima bandyti, bet rezultatai bus žymiai prastesni), ir jas rašai per Discord naudodamas komandą /imagine. Tiesiog Discord žinutės laukelyje parašai /imagine, paspaudžiusi Tab arba Enter, ir tada rašai savo aprašymą – vadinamąjį prompt.
Paprastas pavyzdys: /imagine a cat sitting on a windowsill, rainy day, cozy atmosphere, soft lighting
Per keliasdešimt sekundžių Midjourney sugeneruos keturis variantus. Tada galėsi pasirinkti, kurį nori patobulinti (U1-U4 mygtukai – Upscale, padidina ir pagerina kokybę) arba sugeneruoti naujus variantus pagal tą patį prompt (V1-V4 – Variation, sukuria panašius, bet skirtingus variantus).
Keletas patarimų, kaip rašyti gerus prompt’us:
- Būk konkretus – „a woman” duos vidutinį rezultatą, „a 30-year-old Lithuanian woman with dark hair, wearing a linen dress, standing in a rye field at golden hour” duos ką nors įspūdingo
- Nurodyk stilių – „photorealistic”, „oil painting”, „watercolor”, „anime style”, „cinematic”, „editorial photography” – šie žodžiai labai keičia galutinį vaizdą
- Minėk apšvietimą – „golden hour lighting”, „studio lighting”, „dramatic shadows”, „soft natural light” – apšvietimas yra vienas svarbiausių elementų
- Nurodyk perspektyvą – „close-up portrait”, „wide angle”, „bird’s eye view”, „macro photography”
Parametrai, kurie iš tikrųjų keičia rezultatą
Midjourney turi daugybę parametrų, kuriuos galima pridėti prie prompt’o pabaigoje su dviem brūkšneliais. Čia yra tie, kuriuos reikia žinoti nuo pat pradžių:
–ar (aspect ratio) – nustato paveikslėlio proporcijas. Pavyzdžiui, --ar 16:9 sukurs platų formatą, tinkamą ekranams. --ar 9:16 – vertikalus formatas, puikus Instagram Stories. --ar 1:1 – kvadratas. Tai vienas dažniausiai naudojamų parametrų.
–v (version) – nurodo, kurią Midjourney versiją naudoti. --v 6 šiuo metu yra naujausia ir geriausia. Kartais verta išbandyti --v 5.2, nes ji turi šiek tiek kitokią estetiką.
–style raw – išjungia Midjourney „gražinimo” filtrą. Jei nori fotorealistinių rezultatų be to dirbtinio „AI” grožio, šis parametras labai padeda.
–chaos – skaičius nuo 0 iki 100, nustato, kiek skirtingi bus keturi sugeneruoti variantai. Aukšta reikšmė (pvz., --chaos 80) duos labai skirtingus rezultatus, žema – panašius. Naudingas, kai nori eksperimentuoti.
–no – nurodo, ko nenorite paveikslėlyje. Pavyzdžiui, --no text, watermark, blurry background pašalins šiuos elementus.
–q (quality) – nustato kokybę. --q 2 generuos ilgiau, bet kokybė bus geresnė. Standartinė reikšmė yra 1.
Pavyzdys su parametrais: /imagine a minimalist Lithuanian countryside house, foggy morning, muted colors, architectural photography --ar 16:9 --v 6 --style raw --q 2
Pažangesnės technikos: kai nori daugiau kontrolės
Kai jau susipažinsi su pagrindais, atsiras noras turėti daugiau kontrolės. Štai keletas technikų, kurios padeda pasiekti tiksliai tai, ko nori.
Image prompting – galima naudoti nuotrauką kaip įkvėpimo šaltinį. Tiesiog įkelk paveikslą į Discord (arba naudok URL), tada rašyk prompt’ą. Midjourney atsižvelgs į tavo nuotraukos stilių ar kompoziciją. Labai naudinga, jei turi konkrečią nuotrauką ir nori sukurti kažką panašaus.
Prompt weighting – galima nurodyti, kurie žodžiai svarbiausi, naudojant dvitaškį ir skaičių. Pavyzdžiui: a cat::2 sitting on a table::1 – katė bus svarbesnė nei stalas. Tai subtili, bet galinga technika.
/describe komanda – jei turi paveikslą ir nori sužinoti, kaip jį aprašyti, naudok šią komandą. Midjourney sugeneruos kelis galimus prompt’us, kurie galėjo sukurti tą vaizdą. Puikus būdas mokytis.
Remix mode – įjungus šį režimą (/settings meniu), kai spaudžiate V (Variation) mygtuką, galėsite redaguoti prompt’ą prieš generuojant naują variantą. Tai leidžia iteratyviai tobulinti rezultatą.
Pan ir Zoom – naujesnėse versijose galima „išplėsti” paveikslą į šonus arba atitolinti. Tai naudinga, jei sugeneravai puikų portretą, bet nori matyti daugiau fono.
Dažniausios klaidos ir kaip jų išvengti
Pradedantieji daro panašias klaidas – ir tai normalu. Bet geriau išmokti iš kitų, nei gaišti savo kreditus.
Per trumpi prompt’ai. „A forest” sugeneruos kažką, bet tikrai ne tai, ką įsivaizdavai. Midjourney veikia geriau, kai gauna daugiau konteksto. Nebijok rašyti ilgų aprašymų – 50-100 žodžių prompt’as dažnai duoda žymiai geresnius rezultatus nei 5 žodžiai.
Abstrakčios emocijos be vizualinio konteksto. „A feeling of loneliness” – Midjourney nesupras taip gerai, kaip „a person sitting alone on a bench in an empty park, autumn leaves, overcast sky, muted colors”. Versk emocijas į vizualinius elementus.
Prieštaringi nurodymai. Jei rašai „photorealistic oil painting” – tai prieštarauja pats sau. Apsispręsk, ko nori: fotografinio realizmo ar tapybos stiliaus.
Ignoruoti versijų skirtumus. Midjourney v6 ir v5 duoda labai skirtingus rezultatus. Jei matai internete gražų paveikslą ir bandai atkartoti prompt’ą, patikrink, kuria versija jis buvo sukurtas.
Neeksperimentuoti. Daugelis žmonių sugeneruoja vieną paveikslą, nusivilia ir meta. Tiesą sakant, Midjourney reikalauja iteracijos. Sugeneruok, pažiūrėk, pataisyk prompt’ą, sugeneruok vėl. Geriausi rezultatai ateina po 5-10 iteracijų.
Praktinis pritaikymas: ką realiai galima daryti su Midjourney
Gerai, bet kam tai reikalinga praktiškai? Štai keletas konkrečių panaudojimo atvejų, kurie aktualūs lietuviškame kontekste:
Socialinių tinklų turinys. Jei turi verslą ar asmeninį brendą, Midjourney gali padėti kurti vizualinį turinį Instagram, Facebook ar LinkedIn. Vietoj to, kad mokėtum fotografui ar dizaineriui, gali sukurti unikalius vaizdus pats. Žinoma, reikia atsakingai naudoti – visada pasakyk, kad vaizdas yra AI generuotas, jei tai svarbu tavo auditorijai.
Knygų ir straipsnių iliustracijos. Rašai blogą, el. knygą ar straipsnius? Midjourney gali sukurti unikalias iliustracijas, kurios tiksliai atitinka tavo turinį. Tai žymiai pigiau nei pirkti nuotraukas iš stock bibliotekų.
Koncepcijų vizualizavimas. Architektas, interjero dizaineris ar produkto kūrėjas gali greitai vizualizuoti idėjas klientams, dar prieš pradedant detalų projektavimą. Tai sutaupo laiko ir padeda geriau komunikuoti.
Žaidimų ir kūrybinių projektų asset’ai. Indie žaidimų kūrėjai naudoja Midjourney personažų koncepcijoms, aplinkų eskizams, ikonų idėjoms. Tai neduoda galutinių, paruoštų žaidimui resursų, bet labai pagreitina kūrybinį procesą.
Asmeninis kūrybiškumas. Kartais tiesiog smagu eksperimentuoti – sukurti savo svajonių namo vizualizaciją, pamatyti, kaip atrodytų tavo mėgstamas romanas kaip filmas, ar tiesiog žaisti su idėjomis. Tai gali būti tiesiog malonus hobis.
Midjourney ateitis ir etikos klausimai, kurių negalima ignoruoti
Negalima kalbėti apie Midjourney nepaminint to, kas skauda. AI generuojami vaizdai sukėlė rimtų diskusijų apie autorių teises, menininkų darbo vertę ir dezinformacijos riziką. Tai nėra tik teoriniai klausimai.
Midjourney buvo mokoma ant milijardų paveikslų iš interneto – daugelio jų autoriai niekada nedavė sutikimo. Tai reiškia, kad kai generuoji paveikslą „in the style of [artist name]”, iš tikrųjų naudojiesi tuo menininko darbu be jo žinios ar atlygio. Daugelis menininkų tai laiko vagyste, ir jų argumentai yra pagrįsti.
Ką galima daryti atsakingai? Pirma, nevardink gyvų menininkų vardų savo prompt’uose – tai tiesiogiai kenkia jų verslui. Antra, naudok AI generuotus vaizdus ten, kur anksčiau naudotum stock nuotraukas ar kurtum pats – ne ten, kur kitaip samdytum menininką. Trečia, visada žymėk AI generuotą turinį kaip tokį.
Technologijų pusė taip pat juda greitai. Midjourney nuolat tobulina savo modelius, ir tai, kas šiandien atrodo stebuklingai, po metų bus laikoma pasenusiu. Jau dabar galima generuoti video, kurti 3D modelius, generuoti balsą – viskas susijungia į vieną didelę AI kūrybinių įrankių ekosistemą.
Lietuvoje AI raštingumas dar tik formuojasi. Mokyklos apie tai moko mažai, darbdaviai dar tik pradeda suprasti, kokių įgūdžių reikia. Tai reiškia, kad žmonės, kurie šiandien investuoja laiką mokydamiesi šių įrankių, turės realų pranašumą darbo rinkoje per artimiausius kelerius metus. Ne todėl, kad AI pakeis žmones, bet todėl, kad žmonės, mokantys dirbti su AI, pakeis žmones, kurie to nemoka.
Pradėk nuo mažo – susikurk paskyrą, išbandyk Basic planą vieną mėnesį, eksperimentuok. Blogiausias scenarijus: išleisi 10 eurų ir sužinosi, kad tai ne tau. Geriausias scenarijus: atrasi įrankį, kuris iš esmės pakeis tai, kaip realizuoji savo kūrybines idėjas. Tikimybės yra tavo pusėje.






