Google Cloud AutoML Vision: Træn din egen maskinindlæringsmodel

Indhold

Klargøring af dit datasæt
Gør krav på din gratis prøveperiode på Google Cloud Platform
Opret et nyt GCP-projekt
Aktivér Cloud AutoML og Storage API'er
Opret en Cloud Storage-spand
Tid til at træne: Opbyg dit datasæt
Træning af din maskinlæringsmodel
Hvor nøjagtig er din model?
Sæt din model på prøve!
Afslutter

Maskinlæring (ML) er det sci-fi-lydende koncept, hvor computere underviser i sig selv. I ML leverer du nogle data, der repræsenterer den type indhold, du vil have, at maskinlæringsmodellen skal behandles automatisk, og derefter lærer modellen sig selv baseret på disse data.

Maskinlæring er muligvis banebrydende, men den har også en kæmpe stor hindring for indrejse. Hvis du vil bruge nogen form for ML, er du typisk nødt til at ansætte en maskinlæringsekspert eller en datavidenskabsmand, og begge disse erhverv er i øjeblikket meget efterspurgte!

Googles Cloud AutoML Vision er en ny maskinlæringstjeneste, der sigter mod at bringe ML til masserne ved at gøre det muligt at oprette en maskinlæringsmodel, selvom du har ingen ML-oplevelse. Ved hjælp af Cloud AutoML Vision kan du oprette en billedgenkendelsesmodel, der er i stand til at identificere indhold og mønstre på fotografier, og derefter bruge denne model til at behandle efterfølgende billeder automatisk.

Denne form for visuelt baseret ML kan bruges på mange forskellige måder. Vil du oprette en app, der indeholder oplysninger om et vartegn, produkt eller stregkode, som brugeren peger deres smartphone på? Eller vil du oprette et stærkt søgesystem, der giver brugerne mulighed for at filtrere tusinder af produkter baseret på faktorer som materiale, farve eller stil? I stigende grad er maskinlæring en af de mest effektive måder at levere denne form for funktionalitet.

Selvom det stadig er i beta, kan du allerede bruge Cloud AutoML Vision til at oprette tilpassede maskinlæringsmodeller, der identificerer mønstre og indhold på fotos. Hvis du er ivrig efter at finde ud af, hvad al maskinlæringssummen handler om, viser jeg dig i denne artikel, hvordan du bygger din egen billedgenkendelsesmodel og derefter bruger den til at behandle nye fotos automatisk.

Klargøring af dit datasæt

Når du arbejder med Cloud AutoML, bruger du mærkede fotos som dine datasæt. Du kan bruge alle fotos eller etiketter, du kan lide, men for at hjælpe med at holde denne tutorial ligetil skal jeg lave en simpel model, der kan skelne mellem fotos af hunde og fotos af katte.

Uanset hvad det drejer sig om din model, er det første trin sourcing af nogle passende fotos!

Cloud AutoML Vision kræver mindst 10 billeder pr. Etiket eller 50 til avancerede modeller, for eksempel modeller, hvor de vil være flere etiketter pr. Billede. Jo flere data du leverer, desto større er modellens chancer for korrekt at identificere efterfølgende indhold, så AutoML Vision-dokumenter anbefaler, at du bruger i det mindste 100 eksempler pr. Model. Du skal også give omtrent det samme antal eksempler pr. Etiket, da en urimelig distribution vil tilskynde modellen til at vise bias mod den mest "populære" kategori.

For at få de bedste resultater, skal dine træningsbilleder repræsentere den række billeder, som denne model vil støde på, for eksempel kan du muligvis inkludere billeder taget i forskellige vinkler, i højere og lavere opløsninger og med forskellige baggrunde. AutoML Vision accepterer billeder i følgende formater: JPEG, PNG, WEBP, GIF, BMP, TIFF og ICO, med en maksimal filstørrelse på 30 MB.

Da vi lige eksperimenterer med Cloud AutoML Vision-tjenesten, er chancerne for, at du vil oprette et datasæt så hurtigt og nemt som muligt. For at hjælpe med at holde tingene enkle, downloader jeg en masse gratis stock-fotos af hunde og katte fra Pexels og derefter gemmer katte- og hundefotografierne i separate mapper, da dette vil gøre det lettere at uploade disse fotos senere.

Bemærk, at når du bygger datasæt, der skal bruges i produktionen, skal du tage hensyn til ansvarlige AI-fremgangsmåder for at hjælpe med at forhindre skadelig behandling. For mere information om dette emne, se Googles inkluderende ML-guide og dokumenter med ansvarlig AI-praksis.

Der er tre måder at uploade dine data til AutoMl Vision:

Upload billeder, der allerede er sorteret i mapper, der svarer til dine etiketter.
Importer en CSV-fil, der indeholder billederne, plus deres tilknyttede kategorimærker. Du kan uploade disse fotos fra enten din lokale computer eller fra Google Cloud Storage.
Upload dine billeder ved hjælp af Google Cloud AutoML Vision UI, og anvend derefter etiketter på hvert billede. Dette er den metode, jeg vil bruge i denne tutorial.

Gør krav på din gratis prøveperiode på Google Cloud Platform

For at bruge Cloud AutoML Vision har du brug for en Google Cloud Platform (GCP) -konto. Hvis du ikke har en konto, kan du tilmelde dig en gratis prøveperiode på 12 måneder ved at gå over til Try Cloud Platform for gratis side og derefter følge instruktionerne. Du vilje nødt til at indtaste dine betalingskort- eller kreditkortoplysninger, men i henhold til FAQ i gratis Tier bruges disse bare til at bekræfte din identitet, og du bliver ikke debiteret, medmindre du opgraderer til en betalt konto.

Det andet krav er, at du skal aktivere fakturering for dit AutoML-projekt. Hvis du kun lige har tilmeldt dig en gratis prøveversion, eller du ikke har nogen faktureringsoplysninger tilknyttet din GPC-konto, så:

Gå over til GCP-konsollen.
Åbn navigationsmenuen (det foret ikon i øverste venstre hjørne af skærmen).
Vælg "Fakturering."
Åbn rullemenuen "Min fakturering" efterfulgt af "Administrer faktureringskonti."
Vælg "Opret konto", og følg derefter instruktionerne på skærmen for at oprette en faktureringsprofil.

Opret et nyt GCP-projekt

Du er nu klar til at oprette dit første Cloud AutoML Vision-projekt:

Gå over til siden Administrer ressourcer.
Klik på "Opret projekt."
Giv dit projekt et navn, og klik derefter på "Opret."

Hvis du har flere faktureringskonti, skal GCP spørge, hvilken konto du vil knytte til dette projekt. Hvis du har en enkelt faktureringskonto og du er faktureringsadministrator, så linkes denne konto automatisk til dit projekt.

Alternativt kan du vælge en faktureringskonto manuelt:

Åbn GCP-konsolens navigationsmenu, og vælg derefter "Fakturering".
Vælg "Link en faktureringskonto."
Vælg "Indstil konto", og vælg derefter den faktureringskonto, du vil knytte til dette projekt.

Aktivér Cloud AutoML og Storage API'er

Når du opretter din model, gemmer du alle dine træningsbilleder i en Cloud Storage-spand, så vi er nødt til at aktivere AutoML og Google Cloud Storage API'er:

Åbn GCP-navigationsmenuen, og vælg "API'er & tjenester> Dashboard."
Klik på "Aktivér API'er og tjenester."
Begynd at skrive “Cloud AutoML API”, og vælg det derefter, når det vises.
Vælg "Aktiver."
Naviger tilbage til skærmbilledet "API'er og tjenester> Dashboard> Aktivér API'er og tjenester".
Begynd at skrive "Google Cloud Storage", og vælg det, når det vises.
Vælg "Aktiver."

Opret en Cloud Storage-spand

Vi opretter vores Cloud Storage-spand ved hjælp af Cloud Shell, som er en online, Linux-baseret virtuel maskine:

Vælg ikonet "Aktivér Google Cloud Shell" fra overskriftslinjen (hvor markøren er placeret i følgende skærmbillede).

En Cloud Shell-session åbnes nu langs bunden af konsollen. Vent, mens Google Cloud Shell opretter forbindelse til dit projekt.
Kopier / indsæt følgende kommando i Google Cloud Shell:

PROJECT = $ (gcloud config get-value-projekt) && BUCKET = "$ {PROJECT} -vcm"

Tryk på "Enter" -tasten på dit tastatur.
Kopier / indsæt den næste kommando i Google Cloud Shell:

gsutil mb -p $ {PROJECT} -c regional -l us-central1 gs: // $ {BUCKET}

Tryk på “Enter” -tasten.
Giv tilladelse til AutoML-tjenesten til at få adgang til dine Google Cloud-ressourcer ved at kopiere / indsætte følgende kommando og derefter trykke på "Enter" -tasten:

PROJECT = $ (gcloud config get-value-projekt) gcloud-projekter add-iam-policy-binding $ PROJECT --member = "serviceAccount: [email protected]" --role = "roller / ml. admin "gcloud-projekter add-iam-policy-binding $ PROJECT --member =" serviceAccount: [email protected] " --role =" roller / storage.admin "

Tid til at træne: Opbyg dit datasæt

Med denne opsætning af vejen er vi nu klar til at uploade vores datasæt! Dette indebærer:

Oprettelse af et tomt datasæt.
Importerer fotos til datasættet.
Tildeler mindst en etiket til hvert foto. AutoML Vision ignorerer fuldstændigt fotos, der ikke har en etiket.

For at gøre mærkningsprocessen lettere, vil jeg uploade og mærke alle mine hundefotos, før jeg tackle katfotografierne:

Gå over til AutoML Vision UI (stadig i beta i skrivende stund).
Vælg "Nyt datasæt."
Giv dit datasæt et beskrivende navn.
Klik på "Vælg filer."
I det efterfølgende vindue skal du vælge alle dine hundefotos og derefter klikke på "Åbn."
Da vores billeder ikke har mere end en etiket, kan vi lade "Aktivér multimærkeklassificering" deaktiveret. Klik på "Opret datasæt."

Når uploaden er afsluttet, fører Cloud AutoML Vision UI dig til en skærm, der indeholder alle dine billeder, plus en oversigt over alle etiketter, du har anvendt på dette datasæt.

Da vores datasæt i øjeblikket kun indeholder billeder af hunde, kan vi mærke dem en masse:

I menuen til venstre skal du vælge "Tilføj etiket."
Skriv "hund", og tryk derefter på "Enter" -tasten på dit tastatur.
Klik på "Vælg alle billeder."
Åbn rullemenuen "Mærke", og vælg "hund."

Nu har vi mærket alle vores hundefotos, det er tid til at gå videre til kattebillederne:

Vælg "Tilføj billeder" fra overskriftslinjen.
Vælg "Upload fra din computer."
Vælg alle dine kattefotos, og klik derefter på "Åbn."
I menuen til venstre skal du vælge "Tilføj etiket."
Skriv "kat", og tryk derefter på "Enter" -tasten på dit tastatur.
Gå igennem og vælg hvert kattefoto ved at holde musepekeren over billedet og derefter klikke på det lille markeringsikon, når det vises.
Åbn rullemenuen "Label", og vælg "Cat."

Træning af din maskinlæringsmodel

Nu har vi vores datasæt, det er tid til at træne vores model! Du modtager en compute time gratis træning pr. model for op til 10 modeller hver måned, der repræsenterer intern beregning og derfor muligvis ikke korrelerer med en faktisk time på uret.

For at træne din model skal du blot:

Vælg AutoML Vision UI's fane "Tog".
Klik på "Start træning."

Den tid, det tager Cloud AutoML Vision at træne din model, varierer afhængigt af den mængde data, du har leveret, skønt det ifølge de officielle dokumenter skal tage ca. 10 minutter. Når din model er blevet trænet, distribuerer Cloud AutoML Vision den automatisk og sender en e-mail, der giver dig besked om, at din model nu er klar til brug.

Hvor nøjagtig er din model?

Inden du sætter din model på prøve, kan du eventuelt foretage nogle justeringer for at sikre, at dens forudsigelser er så nøjagtige som muligt.

Vælg fanen “Evaluer”, og vælg derefter et af dine filtre i menuen til venstre.

På dette tidspunkt viser AutoML Vision UI følgende oplysninger for denne etiket:

Resultatgrænse. Dette er niveauet af tillid, som modellen skal have for at tildele en etiket til et nyt foto. Du kan bruge denne skyderen til at teste den påvirkning, som forskellige tærskler har på dit datasæt, ved at overvåge resultaterne i den ledsagende præcisionsgenkaldsgraf. Lavere tærskler betyder, at din model klassificerer flere billeder, men der er en øget risiko for, at den misidentificerer fotos. Hvis tærsklen er høj, klassificerer din model færre billeder, men den bør også forkert identificere færre billeder.
Gennemsnitlig præcision. Dette er, hvor godt din model klarer sig på tværs af alle score tærskler, hvor 1,0 er den maksimale score.
Præcision. Jo højere præcision, jo færre falske positiver skal du støde på, og det er her modellen anvender den forkerte etiket på et billede. En model med høj præcision mærker kun de mest relevante eksempler.
Minde om. Ud af alle eksemplerne, der skulle have fået tildelt en etiket, fortæller huskningen, hvor mange af dem der faktisk blev tildelt en etiket. Jo højere tilbagekaldelsesprocent, jo færre falske negativer skal du støde på, og det er her modellen ikke markerer et billede.

Sæt din model på prøve!

Nu kommer den sjove del: at kontrollere, om din model kan identificere, om et foto indeholder en hund eller en kat, ved at generere en forudsigelse baseret på data, som den ikke har set før.

Grib et foto der var ikke inkluderet i dit originale datasæt.
I AutoML Vision Console skal du vælge fanen “Predict”.
Vælg "Upload billeder."
Vælg det billede, du vil have AutoML Vision til at analysere.
Efter nogle få øjeblikke kommer din model til at forudsige - forhåbentlig er den korrekt!

Bemærk, at mens Cloud AutoML-visionen er i beta, kan der være en opvarmningsforsinkelse med din model. Hvis din anmodning returnerer en fejl, skal du vente et par sekunder, før du prøver igen.

Afslutter

I denne artikel kiggede vi på, hvordan du kan bruge Cloud AutoML Vision til at træne og implementere en brugerdefineret læringsmodel. Tror du, at værktøjer som AutoML har potentialet til at få flere til at bruge maskinlæring? Fortæl os det i kommentarerne herunder!

Indhold

Klargøring af dit datasæt

Gør krav på din gratis prøveperiode på Google Cloud Platform

Opret et nyt GCP-projekt

Aktivér Cloud AutoML og Storage API'er

Opret en Cloud Storage-spand

Tid til at træne: Opbyg dit datasæt

Træning af din maskinlæringsmodel

Hvor nøjagtig er din model?

Sæt din model på prøve!

Afslutter

Find ud af, hvordan du maksimerer Facebook-markedsføring for kun $ 35

Facebook Messenger desktop-app, gruppevisning, mere på vejen

Se Xiaomi sende Redmi Note 7 til plads til en fotoshoot

Xiaomi driller Redmi Y3 med 32MP selfie-kamera, 24. april lancering

Xiaomi lover at nedbringe mindst nogle af de modbydelige MIUI-annoncer