2024 Författare: Howard Calhoun | [email protected]. Senast ändrad: 2023-12-17 10:41
Det är svårt för en modern människa att föreställa sig livet utan internet och nästan omedelbar tillgång till informationskällor. Användaren tänker sällan på hur sökningen efter det önskade innehållet i nätverket går till. Men det här är väldigt intressant.
Ett informationshämtningssystem (IPS) är ett komplext mjuk- och hårdvarusystem som väljer information på användarens begäran. Information lagras på servrar i digital form, som böcker förr fanns på bibliotekens hyllor. Systemet består av många delsystem. Var och en utför sin uppgift i processen att behandla användarens begäran och förse honom med information i text eller ljudform. Mångfalden av uppgifter som ska lösas bestämmer komplexiteten i arkitekturen hos moderna informationshämtningssystem (en förkortning av informationshämtningssystemet). En sorts "svart låda": vid ingången - texten i förfrågan, vad som finns inuti - är okänt, vid utgången - omfattande information.
Indataströmmar
Begäran om information som en person skapar i textform på skärmen på sin gadget,utgör en liten del av de förfrågningar som behandlas av sökmotorn. Huvuduppsättningen av sökfrågor bildas av robotar som accepterar en mänsklig begäran och utför en sökning i flera steg och feedback med användaren. Informationshämtningssystem inkluderar välkända Google, Yandex och andra, som behandlar miljontals förfrågningar dagligen.
Källsökobjekt
Uppsättningen av initiala objekt av intresse för sökningen är dokument, poster, videor, bilder och mer. De skapas utanför IPS. Det allmänna informationslagrings- och hämtningssystemet bör ha ett inbyggt bibliografiskt system - en sorts katalog som låter dig söka efter alla slags objekt.
Objekt eller deras digitala transformationer blir en "ingångsresurs" till IPS. Det är bland dem som informationen som användaren behöver väljs ut.
Externa källor
Vyn för informationsurval använder externa kunskapskällor. Det här är informationen som användaren letar efter. Filmens titel, ett citat från boken och mer. För en datorsökning måste denna information översättas till en fråga på ett algoritmiskt språk. I IPS görs detta med blocket för att skapa, indexera och utveckla frågor.
Helst borde dessa tre processer – representation, indexering och frågeutveckling – förlita sig på identiska kunskapskällor, men i praktiken är detta inte möjligt.
Kunskapskällor bör ständigt granskas och uppdateras, och uppdateringen bör vara identisk ochsynkroniserad. Och en extern kunskapskälla föregår alltid kronologisk användning i sökmotorer för en fråga, ibland flera år.
Föreställningar
Representationer av originalobjekten består av indata i någon kombination eller transformerade i enlighet med reglerna och algoritmerna för ett visst informationshämtningssystem.
Visningar är mer eller mindre transformerade kopior av det ursprungliga sökobjektet. I samlingen av oredigerade fulltexter är varje text sin egen representation. I samlingen av föremål av museiutställningar och artefakter kan representationen vara en transformerad beskrivning av föremålet med dess bild. I vissa fall kan representationen delvis härledas från originalobjektet och delvis från beskrivningen: i bibliografiska sökmotorer härleds representationer från objektet - till exempel kommer titel, författares namn att kombineras med anteckningen av verket.
Sökbart index
Eftersom information i informationshämtningssystem lagras i form av en representation är det logiskt att anta att sökningen utförs enligt representationen och, efter urval, ges till användaren. I praktiken är så inte fallet. Till exempel begränsar de nuvarande onlinebibliotekskatalogerna vanligtvis sökningar till ett fåtal fält: författare, titel och undertexter i en vy som innehåller andra fält som inte söks. Detta är tillräckligt skäl till varför det är nödvändigt att särskiljaen vy och ett sökbart index, som är sökdelen av vyn. Den definierar allt som ska vara sökbart. Ett sökbart index, som vyn och källobjektet, kan delas upp i separata underindex för att ge mer exakta, riktade sökningar
Sökmotorer har vanligtvis en syntetisk struktur internt för att matcha giltiga sökresultat. Denna struktur är den andra komponenten i det sökbara indexet.
Procedurmässigt kan indexeringsprocessen implementeras på olika sätt: ett sökbart index kan erhållas genom:
- kopierar bokstavligen en sökbar representation;
- genom att kopiera vydetaljerna. Detta kan vara en del av eller alla vyer som fysiskt endast existerar som fragment, distribuerade enligt reglerna för att skapa ett index för sökning, som kommer att samlas in vid behov.
Request design-regler och formella förfrågningar
Frågeteknik är en funktion som förmedlar mellan en användarfråga och en formell fråga. Den omvandlar användarens fråga och matchar den med ordlistorna för hämtningskommando, indexspecifikation och index före hämtning. I början av utvecklingen av IPS tilldelades denna roll traditionellt kvalificerade IT-specialister.
Att utveckla datorfrågor som kan matcha ordboksfrågor till ett sökbart indexsystem kallas vanligtvis "ordboksinmatningsmodulen". Automatisering av denna funktion är lovande och erbjuder möjligheter till sakkunniga och probabilistiska sökmetoder.
En formell begäran blir en formell begäran efter att användarens begäran har konverterats. Exempel på sådana formella transformationer inkluderar trunkering, substitution, normalisering, vektorisering och andra transformationer av den "externa" representationen till de "interna" representationerna av dator IPS (dekryptering - informationshämtningssystem).
Extracted Document Link Sets
Den resulterande uppsättningen informationskällor är logiskt sett en delmängd av vyerna som skapas av matchningsreglerna som tillämpas på den formella frågan av ett sökbart index.
Vanligtvis, men inte nödvändigtvis, finns det en separat sorteringsprocess för den återvunna informationsuppsättningen. Onlinebibliotekskataloger ordnar vanligtvis om mottagna uppsättningar alfabetiskt efter författare innan de visas. I system för informationshämtning som producerar strikta rankningar föregår rankningsordningen eventuell omordning.
Utdataströmmar
Utmatning av sökresultat görs traditionellt på displayen, oftare i form av en ström av objekt som ska användas någon annanstans eller för något annat ändamål, kompletterar huvudsökslingan. Sådana strömmar kan skickas till visualiseringsenheter, lagring för vidare bearbetning, eller använd som indataströmmar till andra urvalstjänster.
Informationshämtningssystem tillåter feedback frånresultatet av valfri urvalsprocess. Resultatet av alla processer kan vara återkoppling till andra processer. Feedback kan utgöra grunden för expertbedömningar i alla skeden.
Rekommenderad:
Centraliserad förv altning: system, struktur och funktioner. Principer för förv altningsmodellen, för- och nackdelar med systemet
Vilken förv altningsmodell är bättre - centraliserad eller decentraliserad? Om någon som svar pekar på en av dem är han dåligt insatt i ledning. För det finns inga dåliga och bra modeller inom management. Allt beror på sammanhanget och dess kompetenta analys, vilket gör att du kan välja det bästa sättet att styra företaget här och nu. Centraliserad förv altning är ett bra exempel på detta
Betalning för bränsle och smörjmedel: kontraktsutförande, beräkningsförfarande, regler och funktioner för registrering, periodisering och betalning
Situationer uppstår ofta när en anställd på grund av produktionsbehov tvingas använda personlig egendom. Oftast talar vi om användningen av personliga fordon för affärsändamål. Dessutom är arbetsgivaren skyldig att ersätta de relaterade kostnaderna: bränsle och smörjmedel (POL), avskrivningar och andra kostnader
Icke-bostadsbestånd: juridisk definition, typer av lokaler, deras syfte, regulatoriska dokument under registreringen och funktioner för överföring av bostäder till lokaler
Artikeln tar hänsyn till definitionen av lokaler som inte är bostäder, dess huvudsakliga egenskaper. Skälen till den ökande populariteten för att förvärva lägenheter med sikte på att de senare kan flyttas till lokaler avslöjas. En beskrivning av funktionerna i översättning och de nyanser som kan uppstå i detta fall presenteras
Klassificering av förpackningar på förpackningsplatsen: typer, syfte, funktioner och egenskaper, grundläggande krav för förpackning
Idag är det vanligt att klassificera förpackningar efter ett antal funktioner. Bland dem, packplatsen; material som används vid tillverkningen; formen; användningsfrekvens; syftet med behållaren; dimensioner och lastkapacitet. I den här artikeln kommer vi att överväga typerna av förpackningar, klassificering och egenskaper för var och en av dem
Skyddsanordningar: syfte, typer, klassificering, specifikationer, installation, funktioner för drift, inställningar och reparation
Skyddsenheter är för närvarande i drift nästan överallt. De är utformade för att skydda både elektriska nätverk och elektrisk utrustning, olika maskiner etc. Det är mycket viktigt att korrekt installera och följa driftreglerna så att enheterna i sig inte orsakar brand, explosion etc