Internet

Vad är semantisk integration?

Semantisk integration är en term som används i flera sammanhang över olika områden inom dataponstruktion, programmering, hantering och administration.I allmänhet hänvisar det till att samla information från en eller flera olika källor för att skapa ett system där informationen är organiserad på ett sätt som är vettigt för en användare.Semantisk integration handlar ofta om att definiera och etablera metadata -anslutningar eller förhållanden mellan olika delar av de olika datakällorna så att de kan vara logiskt strukturerade.Detta kan innebära att skapa relationella anslutningar mellan två separata databaser, bygga en graf över hur delar av olika webbplatser relaterar till varandra eller integrera faktadata från ett okänt, godtyckligt format till en kortfattad poststruktur.Många praktiska tillämpningar för ett fullt implementerat semantiskt integrationssystem finns, inklusive forskningsbibliotek eller nätverk, mer organiska sökmotoralgoritmer som kan extrapolera sammanhang från en sökning och, i slutändan mdash;genom användning av Metadata Publishing MDASH;Sömlös integration av olika datorsystem för datautbyte.

Det slutliga målet för semantisk integration i de flesta fall är att kunna associera information på ett dynamiskt sätt.I ett mycket enkelt exempel kan detta innebära att kunna associera fält i en databas med fält i en annan databas, trots att de inte är exakta matchningar, till exempel att relatera ett fält med namnet storlek till ett fält med namnet höjd.Denna förening kan utföras genom användardefinierade regler som specifikt länkar de två, eller så kan det göras med algoritmer som jämför de numeriska data i fälten och bestämmer en sannolik matchning.Ordstorleken och höjden blir sedan metadata -termer som andra externa semantiska integrationssystem kanske kan använda för att hitta informationen för en användare utan att behöva veta specifikt hur ett enda system lagrar data.

I komplexa semantiska integrationssystem, till exempelDe som är utformade för forskning, metadatapublikation och delning är en viktig komponent för drift.Metadata kan avlägsnas från dokument för att bilda stora relationella datastrukturer som kan hjälpa till i frågor.Detta innebär att forskningsdokument om alla ämnen kan integreras i ett system som mäter och registrerar ordfrekvensen, och dessa ord kan hjälpa till i användarsökningar efter information, vilket gör att relaterade ämnen kan listas från alla källor utan behov av specifika konverteringar.

En av de utmaningar som möter designers av semantiska integrationssystem är hur man samlar uppgifterna.Att använda människor för att klassificera och göra relationer mellan data från olika källor kan vara tidskrävande och i slutändan mycket beroende av personens individuella upplevelser.När algoritmer används för att automatiskt göra föreningar kan vissa relationer förbises på grund av någon mindre skillnad att algoritmen inte kan lösa.En metod för att implementera semantisk integration i stor skala använder inlärningsbaserade algoritmer i samband med mänsklig baserad reglerhantering och i vissa fall faktiska mänskliga beslutsfattande under processen.