IPS är Syfte och funktioner för system för informationshämtning

Innehållsförteckning:

IPS är Syfte och funktioner för system för informationshämtning
IPS är Syfte och funktioner för system för informationshämtning

Video: IPS är Syfte och funktioner för system för informationshämtning

Video: IPS är Syfte och funktioner för system för informationshämtning
Video: SUSTAINABLE POWER FROM GERMANY: Electric Locomotiv - High-Tech on Rails | WELT Documentary 2024, April
Anonim

Det är svårt för en modern människa att föreställa sig livet utan internet och nästan omedelbar tillgång till informationskällor. Användaren tänker sällan på hur sökningen efter det önskade innehållet i nätverket går till. Men det här är väldigt intressant.

Ett informationshämtningssystem (IPS) är ett komplext mjuk- och hårdvarusystem som väljer information på användarens begäran. Information lagras på servrar i digital form, som böcker förr fanns på bibliotekens hyllor. Systemet består av många delsystem. Var och en utför sin uppgift i processen att behandla användarens begäran och förse honom med information i text eller ljudform. Mångfalden av uppgifter som ska lösas bestämmer komplexiteten i arkitekturen hos moderna informationshämtningssystem (en förkortning av informationshämtningssystemet). En sorts "svart låda": vid ingången - texten i förfrågan, vad som finns inuti - är okänt, vid utgången - omfattande information.

Kortfil i verkligheten
Kortfil i verkligheten

Indataströmmar

Begäran om information som en person skapar i textform på skärmen på sin gadget,utgör en liten del av de förfrågningar som behandlas av sökmotorn. Huvuduppsättningen av sökfrågor bildas av robotar som accepterar en mänsklig begäran och utför en sökning i flera steg och feedback med användaren. Informationshämtningssystem inkluderar välkända Google, Yandex och andra, som behandlar miljontals förfrågningar dagligen.

Källsökobjekt

Uppsättningen av initiala objekt av intresse för sökningen är dokument, poster, videor, bilder och mer. De skapas utanför IPS. Det allmänna informationslagrings- och hämtningssystemet bör ha ett inbyggt bibliografiskt system - en sorts katalog som låter dig söka efter alla slags objekt.

Objekt eller deras digitala transformationer blir en "ingångsresurs" till IPS. Det är bland dem som informationen som användaren behöver väljs ut.

Sök efter information
Sök efter information

Externa källor

Vyn för informationsurval använder externa kunskapskällor. Det här är informationen som användaren letar efter. Filmens titel, ett citat från boken och mer. För en datorsökning måste denna information översättas till en fråga på ett algoritmiskt språk. I IPS görs detta med blocket för att skapa, indexera och utveckla frågor.

Helst borde dessa tre processer – representation, indexering och frågeutveckling – förlita sig på identiska kunskapskällor, men i praktiken är detta inte möjligt.

Kunskapskällor bör ständigt granskas och uppdateras, och uppdateringen bör vara identisk ochsynkroniserad. Och en extern kunskapskälla föregår alltid kronologisk användning i sökmotorer för en fråga, ibland flera år.

System för informationssökning
System för informationssökning

Föreställningar

Representationer av originalobjekten består av indata i någon kombination eller transformerade i enlighet med reglerna och algoritmerna för ett visst informationshämtningssystem.

Visningar är mer eller mindre transformerade kopior av det ursprungliga sökobjektet. I samlingen av oredigerade fulltexter är varje text sin egen representation. I samlingen av föremål av museiutställningar och artefakter kan representationen vara en transformerad beskrivning av föremålet med dess bild. I vissa fall kan representationen delvis härledas från originalobjektet och delvis från beskrivningen: i bibliografiska sökmotorer härleds representationer från objektet - till exempel kommer titel, författares namn att kombineras med anteckningen av verket.

Att hitta det du behöver
Att hitta det du behöver

Sökbart index

Eftersom information i informationshämtningssystem lagras i form av en representation är det logiskt att anta att sökningen utförs enligt representationen och, efter urval, ges till användaren. I praktiken är så inte fallet. Till exempel begränsar de nuvarande onlinebibliotekskatalogerna vanligtvis sökningar till ett fåtal fält: författare, titel och undertexter i en vy som innehåller andra fält som inte söks. Detta är tillräckligt skäl till varför det är nödvändigt att särskiljaen vy och ett sökbart index, som är sökdelen av vyn. Den definierar allt som ska vara sökbart. Ett sökbart index, som vyn och källobjektet, kan delas upp i separata underindex för att ge mer exakta, riktade sökningar

Sökmotorer har vanligtvis en syntetisk struktur internt för att matcha giltiga sökresultat. Denna struktur är den andra komponenten i det sökbara indexet.

Procedurmässigt kan indexeringsprocessen implementeras på olika sätt: ett sökbart index kan erhållas genom:

  • kopierar bokstavligen en sökbar representation;
  • genom att kopiera vydetaljerna. Detta kan vara en del av eller alla vyer som fysiskt endast existerar som fragment, distribuerade enligt reglerna för att skapa ett index för sökning, som kommer att samlas in vid behov.
Sökhantering
Sökhantering

Request design-regler och formella förfrågningar

Frågeteknik är en funktion som förmedlar mellan en användarfråga och en formell fråga. Den omvandlar användarens fråga och matchar den med ordlistorna för hämtningskommando, indexspecifikation och index före hämtning. I början av utvecklingen av IPS tilldelades denna roll traditionellt kvalificerade IT-specialister.

Att utveckla datorfrågor som kan matcha ordboksfrågor till ett sökbart indexsystem kallas vanligtvis "ordboksinmatningsmodulen". Automatisering av denna funktion är lovande och erbjuder möjligheter till sakkunniga och probabilistiska sökmetoder.

En formell begäran blir en formell begäran efter att användarens begäran har konverterats. Exempel på sådana formella transformationer inkluderar trunkering, substitution, normalisering, vektorisering och andra transformationer av den "externa" representationen till de "interna" representationerna av dator IPS (dekryptering - informationshämtningssystem).

Extracted Document Link Sets

Den resulterande uppsättningen informationskällor är logiskt sett en delmängd av vyerna som skapas av matchningsreglerna som tillämpas på den formella frågan av ett sökbart index.

Vanligtvis, men inte nödvändigtvis, finns det en separat sorteringsprocess för den återvunna informationsuppsättningen. Onlinebibliotekskataloger ordnar vanligtvis om mottagna uppsättningar alfabetiskt efter författare innan de visas. I system för informationshämtning som producerar strikta rankningar föregår rankningsordningen eventuell omordning.

Dataanalys
Dataanalys

Utdataströmmar

Utmatning av sökresultat görs traditionellt på displayen, oftare i form av en ström av objekt som ska användas någon annanstans eller för något annat ändamål, kompletterar huvudsökslingan. Sådana strömmar kan skickas till visualiseringsenheter, lagring för vidare bearbetning, eller använd som indataströmmar till andra urvalstjänster.

Informationshämtningssystem tillåter feedback frånresultatet av valfri urvalsprocess. Resultatet av alla processer kan vara återkoppling till andra processer. Feedback kan utgöra grunden för expertbedömningar i alla skeden.

Rekommenderad: