Anonim

Wat zijn API's voor beeldherkenning en wat kunnen ze voor u doen? In dit artikel wordt duidelijk wat beeldherkenning is, wat een API doet en hoe het u of uw bedrijf kan helpen meer uit internet te halen. Beeldherkenning heeft een enorm potentieel voor bedrijven en voor individuele visueel gehandicapte internetgebruikers.

Wat is een API voor beeldherkenning?

Bij beeldherkenning detecteert een stukje software de kenmerken van een afbeelding en categoriseert deze nauwkeurig. Als u bijvoorbeeld een afbeelding van een Ferrari 458 uploadt naar een API voor beeldherkenning, moet deze herkennen dat het een auto is en dat deze rood is (of zou moeten zijn). Afhankelijk van de API kan verdere classificatie mogelijk zijn, afhankelijk van het type afbeelding dat u gebruikt.

Dit lijkt misschien heel eenvoudig - mensen kunnen meestal naar een foto kijken en je vertellen waar het meestal zonder te proberen is - maar dit was een moeilijk probleem om computers te leren op te lossen. Er is veel werk verzet om erachter te komen hoe een computer kan begrijpen hoe dingen eruit zien, en we hebben grote stappen gemaakt, van de mogelijkheid om reverse image zoekopdrachten te doen naar het beroemde Deep Dream-netwerk van Google.

Een API is een applicatieprogramma-interface. Het is in wezen een tussenpersoon tussen programmaroutines die het ene element vertelt hoe met een ander te werken, of biedt de tools die ze nodig hebben om een ​​functie uit te voeren. Er zijn tientallen soorten API's die allerlei doelen kunnen bereiken, met behulp van een scala aan programmeertalen. In deze context is een API voor beeldherkenning het hulpmiddel dat u kunt gebruiken om toegang te krijgen tot de diepe leerkracht van sommige commerciële beeldherkenningssystemen.

U hebt veel rekenkracht nodig om beeldherkenning uit te voeren. Je hebt massa's gegevens nodig en de kracht om alles te interpreteren. De meeste gebruikers hebben simpelweg niet de enorme middelen om hun eigen deep learning-machine te bouwen. Grote namen zoals Google's Vision API, Microsoft's Face API, ImageNet en anderen hebben dergelijke machines en geven toegang tot deze via API's, gratis of tegen betaling. Dit geeft bedrijven van elke omvang toegang tot deze kracht en gebruikers krijgen hierdoor nieuwe ervaringen.

Hoe gaat beeldherkenning onze internetervaring veranderen?

Verschillende internetgebruikers krijgen verschillende voordelen van beeldherkenning. Laten we eens kijken naar een hypothetische website-eigenaar en een hypothetische gebruiker om te zien hoe beide partijen hiervan kunnen profiteren.

De zakelijke voordelen van beeldherkenning

Laten we bijvoorbeeld zeggen dat u een portaal voor zelfverkoop beheert, vergelijkbaar met Etsy of een datingsite. U wilt de kwaliteit en geschiktheid van alle door gebruikers geüploade afbeeldingen beheren. U wilt alle afbeeldingen voor volwassenen of ongeschikte afbeeldingen blokkeren en ze in de juiste categorieën sorteren, maar u kunt het onmogelijk allemaal met de hand doen.

Voer de API voor beeldherkenning in. U kunt de API, samen met een geschikte machine voor beeldherkenning, gebruiken om elke afbeelding te scannen en te definiëren volgens ingestelde criteria. U kunt dus de bibliotheek met afbeeldingen scannen op onfatsoenlijke afbeeldingen en deze verwijderen. U kunt de afbeeldingen scannen en sorteren die voedsel bevatten in de categorie "voedsel" en gebreide kleding in de categorie "wollen". Nadat u de API heeft verteld wat te doen, is het proces geautomatiseerd.

Er zijn hier ook mogelijkheden voor augmented reality en interactief beeld en video. U kunt beeldherkenning gebruiken om een ​​programma objecten in de echte wereld te laten herkennen. U kunt bijvoorbeeld een foto maken van een paar sneakers die iemand op straat draagt. Als het programma de sneakers herkent, kan de afbeelding worden aangevuld met een link om ze voor uzelf te kopen. Dit komt het bedrijfsleven ten goede (het biedt een directe verkoopkans) en komt de gebruiker ten goede (ze krijgen nu wat ze willen).

De gebruikersvoordelen van beeldherkenning

Het bovenstaande sneaker-voorbeeld is slechts een voor de hand liggende manier waarop gebruikers kunnen profiteren van beeldherkenning. Augmented reality betekent dat we direct toegang hebben tot beoordelingen, prijsinformatie en veel gegevens door eenvoudig een foto van een product te maken. Dat geeft gebruikers enorme hoeveelheden gegevens om hen te helpen een aankoopbeslissing te nemen.

Mark Zuckerberg vatte in zijn toespraak over AI eerder dit jaar een vaak over het hoofd gezien voordeel van beeldherkenning samen. Hij stelde zich een API voor beeldherkenning voor die werkte met blinde of slechtziende mensen die een beeld konden "lezen" en beschrijven wat het hardop ziet. Dit kan enorme gevolgen hebben voor gehandicapte internetgebruikers - of, met augmented reality, ergens in de echte wereld later.

Beeldherkenning speelt ook een rol bij de veiligheid van voertuigen. De nieuwe autonome rem- en botsingstechnologieën die worden geïntroduceerd, werken op dezelfde manier als de API's waar we het over hadden. Ze scannen en beoordelen afbeeldingen vele malen per seconde om u en uw auto veilig te houden terwijl u onderweg bent. Deze technologie die autonome auto's ook vertelt wat er om hen heen is.

API's voor beeldherkenning zullen niet alleen een revolutie teweegbrengen in onze internetervaring. Ze werken samen met bestaande technologie om een ​​laag interactie en onderdompeling toe te voegen aan de wereld die we zien. Hoewel de voorbeelden van dit artikel beperkt zijn, is er een enorm potentieel voor gaming, films, de auto-industrie, detailhandel, entertainment en elke technologie-industrie. Dit is slechts het begin van wat intelligente systemen kunnen bereiken!

Wat zijn apis voor beeldherkenning en wat kunnen ze voor u doen?