Resource

Çfarë janë “të dhënat”?

Resource

Nga Grezegorz Mlynarski

Përkufizimi më njohur i të dhënave është ai i cili i përshkruan ato si çdo gjë që  mund të përpunohet nga truri ose një kompjuter.

Ky “përpunim”- ose me fjalë të tjera, përdorimi pas modifikimit – është një sine qua non i të dhënave. Ne mund ti zgjedhim të dhënat duke u bazuar në kritere të ndryshme, të tilla si përmbajtja e tyre, madhësia e caktuar, klasifikimi ligjor, apo edhe mënyra se si ne i  shpërndajmë  ato. Në ditët e sotme kategoritë që përdoren më shpesh  janë të dhëna të hapura, të dhënat publike dhe të ashtuquajturat "Big Data”.

Termi "data" mund të përshkruhet me çdo fjalë që karakterizon një send apo fenomen, me çdo numër që detajon parametrat   ose  madhësinë e sendit / apo fenomenit, me çdo imazh që  paraqet të dhënat , me çdo grafik që ilustron ndërvarësinë e  tyre, çdo regjistrim me zë apo figurë i tyre, e kështu me radhë. I njëjti fenomen mund të karakterizohet nga grupe të ndryshme të të dhënave, të cilat të paraqitura apo përshkruara  në një mënyrë të caktuar dhe në një kontekst të caktuar, japin informacion  mbi fenomenin që paraqesin. 

Të dhënat e artikujve shpesh të ngjashëm por që kanë parametra të ndryshëm  nga njëri-tjetri  përmblidhen në një database. Kjo ndihmon që të dhënat të ruhen në një format të qëndrueshëm . Versione të ndryshuara të të njëjtit dokument arkivohen  dhe ruhen  në një database, i cili mundëson mbrojtjen e të dhënave nëse sistemi prishet apo ka probleme me sigurinë. Database  përdoret  në jetën e përditshme në menaxhimin e të dhënave, reklamimin e produkteve në dyqane apo për sondazhe të opinionit publik në periudhën parazgjedhore. Çdo database menaxhohet  me të ashtuquajturat datasheets (faqe të të dhënave), të cilat  ruajnë  të dhënat të  organizuara sipas një kriteri specifik. Nëse të dhënat e duhura janë  paraqitur me software dhe filtra të përshtatshëm , është e mundur të arrihet ne disa përfundimeve  mbi objektet e përshkruara dhe analizimi i të dhënave - me fjalë të tjera, përpunim i tyre  në një mënyrë të tillë që të mund të kuptohen dhe përdoren edhe më tej. Ne mund t'i klasifikojmë  database-t  duke u bazuar qoftë në llojin e  strukturës së tyre (relative , hierarkike, duke u bazuar në  orientimin e  tyre,duke u bazuar në  rrjetin e tyre) ose në mënyrën se si janë menaxhuar (p.sh. operacional ose analitik).

Popullariteti i database vjen  për shkak të informacionit  të drejtpërdrejtë, të lehtë, të qasjes në kohë reale të informacionit që  ofrohet. Database është i përdorshëm për të  formuluar pyetje të duhura, ndoshta nga shumë përdorues në të njëjtën kohë. Për shembull në një faqe interneti të  përhapur  Polake  jakdojade.pl, një projektues i transportit publik, mundëson qindra përdorues  të pyesin pikërisht rreth  rrugëve të njëjta  ose të paktën shumë të ngjashme për të nxjerrë të dhënat nga e njëjta tabelë në të njëjtën kohë. Duke analizuar këtë shembull ne mund të vërejmë se, në sajë të komunikimit pamor të përdoruesve , një database- madje edhe një i madh - mund të jetë ndërveprues. Me fjalë të tjera, database mund të japë  përgjigje për një pyetje dhe të modelojë përmbajtjen dhe formatin e përgjigjes duke u bazuar në zgjedhjen e përdoruesit. Një tjetër shembull për tu përmendur në këtë rast është faqja kërkimore Google. Pyetje pothuajse identike dërgohen në të njëjtën kohë  nga shumë përdorues njëherësh, çka e bën faqen të kthejë  rezultate të njëjta ose shumë të ngjashme. Një term i lidhur me këtë fenomen është i  lartpërmenduri  Big Data. Ne përdorim këtë term për të folur për çdo aspekt  të analizës, për një koleksion të madh, heterogjen dhe dinamik të të dhënave. Big Data revolucionarizoi industrinë e ICR me të ashtuquajturat "4Vs": volum, shumëllojshmëri ,shpejtësi, dhe vlera. Kërkimi në  database-in e faqes së Google, i cili indekson faqet e Internetit nga e gjithë bota, është mbi një milionë gigabajt i madh - i cili shpjegon termin  "i madh" në "Big Data" dhe "volume" në "4Vs". Kur një përdorues shkruan  një pyetje, kalkulues  të fuqishëm të  Google skanojnë database-in për të gjetur përgjigjet më të përshtatshme: faqja analizon të dhëna të ndryshme: imazhe, tekste, numra, harta, filma, etj – pra një  "shumëllojshmëri të tërë".Çdo gjë ndodh në kohë reale. Për më tepër, treguesi i të dhënave në kompjuter asnjëherë nuk ndalon së modifikuari dhe plotësuari database-in, dhe mbi të gjitha , para se të shfaqet  përgjigjja, teksti i faqes analizon vend ndodhjen e përdoruesve dhe pyetjet e tyre të mëparshme – gjë  e cila shpjegon pse pyetja e njëjtë nga dy përdorues të ndryshëm  në pjesë të ndryshme të botës e bërë në të njëjtën ditë, por në kohë të ndryshme mund të sjellin rezultatet krejtësisht të ndryshme.  Kjo cilësi ndihmon të imagjinohet se si database-et e mëdha mund të jenë të vlefshme për shoqërinë dhe për biznesin: përdoruesit mund të mbështeten në rezultatet e përshtatura për të punuar në një grup të dhënash të cilat janë të dobishme për ta dhe strategjitë e tyre; sipërmarrësit përfitojnë nga komunikimi më i mirë me klientët e tyre dhe modelojnë ofertat e tyre sipas nevojave të klientit.

Për të organizuar të dhënat  ne duhet të: përcaktojmë kategorinë e të të dhënave (leksikore, numerike, etj); ti hedhim në tabela dhe të zhvillojmë sisteme për grumbullimin dhe shtimin e tyre në mënyrë automatike; ti mbledhim ;përpunojmë dhe analizojmë ; shpërndajmë dhe  publikojmë. Një shembull i mirë se si kjo funksionon në praktikë është DATA.GOV.UK portal. (http://data.gov.uk) Ky projekt qeveritar, i cili përdor të dhënat publike, u zhvillua për të ndihmuar njerëzit të kuptojnë se si  funksionon vendi dhe cili është drejtimi i përgjithshëm i agjendës aktuale politike. Të dhënat, të ndara në mënyrë të qartë dhe të lehta në përdorim,  bëhen materiale parësore të cilat prodhojnë një vlerë ekonomike dhe sociale të shtuar. Mbi  9000 database, të arritshme nga të gjithë departamentet e administratës qendrore dhe nga institute të tjera të sektorit publik, si dhe zyrat e administratës lokale mund ti sigurojnë qytetarët me  informacionin që ata kanë nevojë, çfarëdo qoftë ky informacion. Data.gov.uk. ju lejon të hyni në të dhënat parësore, të cilat më vonë mund të përdoren për zhvillimin e aplikacioneve të nevojshme. Kjo ndihmon shoqërinë  për të  zgjidhur probleme të veçanta dhe mundëson atë  gjithashtu të monitorojë efikasitetin e reformave politike.

Literaturë shtesë:

1. Adam Maria Gadomski, Global TOGA Meta-Theory: http://erg4146.casaccia.enea.it/wwwerg26701/gad-dict.htm

2. D. Eaves, Find, Play, Share: http://eaves.ca/2009/09/30/three-law-of-open-government-data/

Grzegorz Młynarski – Sociolog dhe projektues i komunikimit. Ai drejton një seminar për transformimet urbane të quajtur "Sociopolis" Është autor i librit. “Open Government in Poland. The backstage of Opengov program” (I disponueshëm edhe në gjuhën polake me “Otwarty rząd w Polsce. Kulisy programu Opengov”). Ai organizon seminare dhe konsultime në lidhje me zbatimin e risive, zhvillon strategji të ndryshimit në  menaxhimi si  dhe zhvillon seanca trajnuese për përgjegjësinë  sociale të biznesit për kompanitë.

Photo in this article was published by JD HANCOCK  on FLICKR under a CC BY 2.0 License

Data

10/29/2013 - 20:41