Hirdetés

Hirdetés

Hirdetés

Hirdetés

Hirdetés

Hirdetés

3D technológia

A gépi látás

Az elmúlt évtizedben a technológia változásai és fejlesztései sokrétűek voltak: eszközmobilitás, big data, mesterséges intelligencia (AI), Dolgok Internete (IoT) robotika, blokklánc, 3D nyomtatás, gépi látás.

Mindezek az újdonságok azért kerültek ki a K+F laboratóriumokból, hogy mindennapi életünket javítsák.

A mérnökök szeretik a technológiákat alkalmazni és adaptálni azokat az ipari környezetekhez és korlátokhoz. Ezen technológiák egy részének vagy mindegyikének átvételére és kihasználására vonatkozó stratégiai tervezés kulcsfontosságúvá vált a feldolgozóiparban.

Fókuszáljunk most a mesterséges intelligenciára és a mélytanulásra épülő képanalízisre vagy a példákon alapuló gépi látásra. A hagyományos, szabályalapú gépi látásmóddal kombinálva az AI segíthet a robotizált összeszerelő egységeknek a megfelelő alkatrészek azonosításában, felismerheti, hogy egy alkatrész hiányzik-e, vagy nem megfelelően van-e felszerelve a termékre,és gyorsabban meghatározhatja, hogy ezek problémát jelentenek-e. Mindezt rendkívül nagy pontossággal.

Először nézzük meg, mi a mélytanulás

Anélkül, hogy túlságosan belemennénk a részletekbe, beszéljünk a GPU hardverről. A GPU-k (grafikus feldolgozó egységek) ezernyi viszonylag egyszerű feldolgozó magot gyűjtenek össze egyetlen chipbe. Felépítésük az ideghálózatokhoz hasonlít. Lehetővé teszik a biológiai ihletésű és többrétegű “mély” ideghálózatok telepítését, amelyek az emberi agyat utánozzák.

Egy ilyen architektúra alkalmazásával a mélytanulás lehetővé teszi konkrét feladatok megoldását anélkül, hogy kifejezetten arra programozták volna. Más szavakkal: a klasszikus számítógépes alkalmazásokat az emberek úgy programozzák, hogy azok “feladat-specifikusak” legyenek, míg a mélytanulás adatokat (képeket, beszédeket, szövegeket, számokat stb.) használ és idegi hálózatokon keresztül képezi le azokat. Az alapképzés során kifejlesztett elsődleges logikától kezdve a mély idegi hálózatok folyamatosan finomítják teljesítményüket, amint új adatokat kapnak.

Ez a koncepció a különbségek felismerésén alapszik: tartósan vizsgálja az adatkészlet változásait és szabálytalanságait. Érzékeny és reagál a kiszámíthatatlan hibákra.

Cognex gépi látás

  1. ábra A hagyományos gépi látás és a mélytanulás közötti nagy különbségek a következők: 1. A fejlesztési folyamat (eszközönként szabályalapú programozás vs. példalapú képzés); 2. Hardverbefektetések (a mélytanulás több feldolgozási és tárolási kapacitást igényel); 3. A gyári automatizálás használati esetei.

Hogyan egészíti ki a mélytanulás a gépi látást?

A gépi látórendszer egy digitális érzékelőn alapul, amelyet egy speciális optikával ellátott ipari kamerába helyeznek. A rendszer képeket készít, amelyeket egy számítógépre továbbítanak. A döntéshozatalhoz a specializált szoftverfolyamatok elemzéseket készítenek és különféle jellemzőket mérnek. A gépi látásrendszerek megbízhatóan teljesítenek a következetesen és megfelelően gyártott alkatrészek esetében. Lépésről lépésre történő szűréssel és szabályalapú algoritmusokkal működnek.

Egy gyártósoron a szabályokon alapuló gépi látórendszer percenként száz vagy akár több ezer alkatrészt is ellenőrizhet nagy pontossággal. Költséghatékonyabb, mint az emberi ellenőrzés. A vizuális adatok kimenete programozási, szabályalapú megközelítésen alapul az ellenőrzési problémák megoldására.

A szabályalapú gépi látás az ismert változókészlettel kiváló eredményekhez vezet. De mi történik, ha a dolgok nem olyan világosak?

Itt lép be a játékba a mélytanulás:

  • Megoldás azon vision alkalmazások esetében, amelyeket szabályalapú algoritmusokkal túl nehéz programozni,
  • Kezeli a zavaró háttereket és az alkatrész megjelenítésben mutatkozó eltéréseket,
  • Karbantartja az alkalmazásokat, és az üzem új képadataival továbbképzi önmagát,
  • Az alaphálózatok újraprogramozása nélkül alkalmazkodik az új példákhoz.

gépi látás

  1. ábra Egy tipikus ipari példa: eltérő méretű, alkalmazási körű, elhelyezkedésű vagy különböző háttérrel rendelkező felületeken lévő hibák keresése.

A vizuálisan hasonló, bonyolult felületi textúrájú és változatos megjelenésű eltérések ellenőrzése komoly kihívást jelent a hagyományos szabályalapú gépi látórendszerek számára. A funkcionális, a felhasználhatóságot befolyásoló hibákat szinte mindig kiszűrik, de ez nem feltétlenül igaz a “kozmetikai” rendellenességek esetében, amelyek már a gyártó igényeitől és preferenciáitól függenek. Sőt mi több: ezeket a hibákat a hagyományos gépi látórendszer is nehezen különbözteti meg. Számos olyan tényező miatt, amelyeket nehezen lehet egymástól elkülöníteni (világítás, színváltozások, görbület vagy látómező), néhány hibadetektálást közismerten nehéz programozni és megoldani egy hagyományos gépi látórendszerrel. Ilyenkor jelent megoldást a mélytanulás.

A mélytanulás előnyei az ipari gyártásban

A szabályalapú gépi látás és a mélytanuláson alapuló képanalízis kiegészítik egymást, nem pedig vagy-vagy lehetőségként működnek a következő generációs gyári automatizálási eszközök adaptálásakor. Egyes alkalmazásokban, például a méréstechnikában a szabályalapú gépi látás továbbra is az előnyben részesített és költséghatékony választás. A nagy eltéréseket és kiszámíthatatlan hibákat magában foglaló összetett ellenőrzésekhez – amelyek túl bonyolultak a hagyományos gépi látórendszerben történő programozáshoz és karbantartáshoz – kiváló alternatívát jelentenek a mélytanulásra épülő eszközök. A gépi látás és a mélytanulás kombinációja erős alapot ad a vállalatoknak mind az operatív működés, mind a befektetésarányos megtérülés vonatkozásában. A beruházások megtérülésének maximalizálása szempontjából elengedhetetlen tehát a hagyományos gépi látás és a mélytanulás közötti különbségek felkutatása, valamint annak megértése, hogy ezek a technológiák kiegészítik egymást – nem pedig versenyeznek egymással, vagy helyettesítik egymást.

gépi látás

3.ábra A gépi látás és a mélytanulás kombinációja erős alapot ad a vállalatoknak mind az operatív működés, mind a befektetésarányos megtérülés vonatkozásában.

Ha többet szeretne megtudni a Cognex mélytanulási megoldásairól, kérjük, látogasson el a cognex.com/ViDi-deep-learning weboldalra.


A COGNEX-ről

A Cognex Corporation által tervezett, fejlesztett, gyártott és forgalmazott termékskála olyan kifinomult gépi látás technológiát tartalmaz, ami a «látás» képességével vértezi fel a termékeket. A Cognex termékek 3/4 vonalkód olvasókat, gépi vision szenzorokat és gépi látás rendszereket tartalmaznak, amelyeket gyárakban, raktárakban és disztribúciós központokban alkalmaznak szerte a világon az áruk minőségének felügyeletére, mérésére, ellenőrzésére, azonosítására és biztosítására a gyártási és disztribúciós folyamat során. A Cognex a világ legnagyobb gépi látás rendszer gyártója, összesen 2 millió ide tartozó termék legyártása és több mint 4 milliárd dollár forgalom realizálása révén a cég 1981-es megalapítása óta. A vállalat az USA Massachusetts államában található Natickben van és a cég Amerikában, Európában és Ázsiában számos regionális irodával és forgalmazóval rendelkezik.


www.cognex.com

További cikkek a témában