Applied Semantics werd in 1998 opgericht (de naam heette toen Oingo) door Adam Weissman en Gil Elbaz, met een interesse om computers meer “menselijk geletterd” te maken. Ze werkten aan het bouwen van een nieuwe architectuur met behulp van hun expertise in het ontwerpen van schaalbare informatiesystemen, de ontwikkeling van databasetoepassingen, software-engineering en natuurlijke taalverwerking (NLP). Samen met een team van linguïsten en software-ingenieurs ontwikkelden ze de gepatenteerde technologie van het bedrijf, CIRCA, die dient als het gemeenschappelijke platform voor alle producten van Applied Semantics.
Google kocht uiteindelijk Applied Semantics in april 2003, waardoor het de eigenaar werd van de AdSense-technologie en de CIRCA-technologie (Conceptual Information Retrieval and Communication Architecture) waarop AdSense is gebouwd.
De CIRCA-ontologie is gebaseerd op een taalonafhankelijke, schaalbare ontologie die bestaat uit miljoenen woorden, samen met wat de woorden betekenen en hoe de woorden conceptueel verband houden met andere betekenissen. Ontologieën worden vaak gebruikt in kunstmatige intelligentie en kennisrepresentatie om een hiërarchische gegevensstructuur te definiëren die alle relevante entiteiten en hun relaties en regels bevat.
Synoniem/antonymie (“goed” is een antoniem van “slecht”)
Gelijkenis (“vraatzuchtig” is vergelijkbaar met “hebzuchtig”)
Hypernymy (is een soort van / heeft een soort) (“paard” heeft een soort “Arabisch”)
Lidmaatschap (“commissaris” is lid van “commissie”)
Metonymie (gehele/deelrelaties) (“motorvoertuig” heeft een deel “koppelingspedaal”)
Stof (bijv. “hout” heeft stof “hout”)
Product (bijv. “Microsoft Corporation” produceert “Microsoft Access”)
Attribuut (“verleden”, “voorafgaand” zijn attributen van “timing”)
Oorzaak (bijv. verplaatsing veroorzaakt verplaatsing/beweging)
Entailment (bijv. kopen betekent betalen)
Laterale bindingen (concepten die nauw met elkaar verband houden, bijv. “hond” en “halsband”)
Een typisch voorbeeld is het woord Java, dat meerdere betekenissen heeft, waaronder een synoniem voor koffie, een Indonesisch eiland en een computerprogrammeertaal.
In het geval van een woord als Ford moet het systeem echter de gegenereerde relaties rangschikken. Ford is zowel een autofabrikant als een bedrijf. Het begrip “autofabrikant” is specifieker dan bedrijf, dus het zou een sterkere waarde krijgen. Dit hele schema van hoe concepten zich verhouden, wordt een ontologie genoemd en vormt de kern van de meeste taalkundige motoren die tegenwoordig worden geproduceerd.
Wat maakt CIRCA-ontologie een zeer slimme keuze voor webreclame?
CIRCA-ontologie begrijpt en extraheert de belangrijkste thema’s van een pagina
CIRCA onderscheidt dubbelzinnige termen
CIRCA gebruikt de context en levert relevante trefwoorden
Voor meer- [http://www.adsense-digest.com]