Skip to main content

Vad matchar schema?

Schema matchning är en teknik som används för att slå samman två eller flera komplexa databaser eller uppsättningar av information i varandra.När användningen av databaser och elektronisk informationslagring blir större och mer komplex via internet måste det definieras metoder för sammanslagning av data från en databas till en annan, och schema matchning är en sådan teknik.Konceptet är enkelt, men verkligheten av datafusion är ganska komplex.

Termen Schema -matchning används synonymt med schemmappning, eftersom användare faktiskt kartlägger data och inte matchar dem.Två eller flera databaser mappas ihop och liknande aspekter av varje databas mappas i varandra.Det vanligaste sättet att slå samman data är att använda exakta referenser.Ett exempel på denna sammanslagningsstil är att kombinera namnkolumnen i en databas med namnkolumnen i en annan databas.

Försättning är vanligtvis inte så enkelt, för människor eller datorer.Med så mycket data som behöver filtreras, kombineras och användas är det viktigt att ha en databas snarare än flera databaser.Schema -kartläggning fokuserar på att göra denna tråkiga process automatiserad och effektivare.Ett exempel på var schemat matchning är nödvändig kan vara när en databas har ett studentfält och en annan databas har ett studentfält för studiefält.Det är samma information, men de något olika titlarna komplicerar ansträngningarna för att blanda den.

Schema-matchning bryter denna komplexa process med sammanslagning av databaser i fyra steg: förintegrering, jämförelse, överensstämmelse och sammanslagning.Innan flera databaser kan slås samman måste de analyseras för likheter och skillnader.I området för schemat matchning kallas detta som före integrationen.Datorn börjar bestämma den mest effektiva integrationsmetoden.

Därefter utvärderar datorn scheman genom att jämföra dem med varandra på en mer detaljerad nivå.I jämförelsesteget tittar datorn på varje databaspost och bestämmer var det kan finnas konflikter.Ett exempel på detta är när ett students intressefält listar läkare och en annan databas listar det som läkare.En person skulle sannolikt känna igen informationen som densamma, men för databasverktyg är de två separata enheter.

När datorn har bestämt alla potentiella konflikter kan den gå vidare med att försöka lösa problemen.Detta kan vara så enkelt som att ändra alla instanser av läkare till läkare.I verkligheten är processen väsentligt mer komplex.

När alla konflikter har fixats kan datorn fortsätta med att slå samman data i schematmatchningsprocessen.I detta skede slås två eller flera databaser samman i en stor databas.Om allt går bra kommer inga konflikter eller fel att uppstå under integration och framtida tillgång till databasen.