Resource

Me përdor Vizualizimin e të dhënave në Mbështetje të Investigimit me të dhëna

Resource

Kur je duke punuar me të dhënat, teknikat e vizualizimit të tyre mund të përdoren në dy mënyra të ndryshme: -për analizimin apo t’u japësh kuptim të dhënave përmes (analizimit vizual); - për të komunikuar disa aspekte të veçanta të të dhënave të ruajtura (prezantimi vizual).

By Tony Hirst from the Open Knowledge Foundation

Kur i përdorim për qëllimi prezantimi, ne gjithashtu duhet të bëjnë dallimin midis vizualizimit të të dhënave dhe informacionit grafik. Përderisa në terma të përgjithshme informacioni grafik ofron një mënyrë prezantimi të të dhënave duke përdorur grafikën kapje-me sy, shpesh ka një kundërshti të marrëdhënies midis vlerës së të dhënave dhe dimensioneve vizuale që ato përfaqësojnë. Në  kontrast, të dhënat e vizualizuara marrin një qëndrim më të saktë kur është fjala për mënyrën se si këto të dhëna përfaqësohen vizualisht, me vendime të marra kujdesshëm, si zgjidhja e limiteve të pranueshme dhe shkallës së përdorimit në rreshtat e tabelave apo në bar tabelat, për shembull, ose duke u pozicionuar apo duke matur nyje  e hartës në rrjet.

Si rezultat, ne mund të shohim se si të dhënat e shfaqura mund të përdoren për analizë – marrëdhënia e mirë përcaktuar ndërmjet vlerave të të dhënave dhe variablave të dukshme të cilat na lejojnë fjalë për fjalë “të shohim” të dhënat tona në mënyrë që t’i japim kuptim dhe të shohim për karakteristika interesante brenda tyre, karakteristika të cilat mund të jenë fshehur në statistikat përmbledhëse. Për shembull, statistikat përmbledhëse (që do të thotë, vlerat, mospërputhjet, korrelacionet) për grupin e mëposhtëm të numrave – të njohur si kuarteti Anscombe – të cilët janë të njëjtë në secilin grup të të dhënave, por kur shikohet një shpërndarje e çrregullt, ne mund të shohim se si të dhënat do të sillen në mënyrë shumë më ndryshe .

Në të parën (majtas lart) rasti do të na shpalosë një tip shkrimi “të zhurmshëm” mbi të dhënat; te e dyta (lart djathtas) rasti na paraqet një seri vlerash që rriten dhe pastaj ulen në një kurbë të butë. Të dhënat e mëposhtme në të majtë tregojnë një tendencë lineare shumë të fortë me një devijim të theksuar - ndoshta ndonjë gabim në të dhëna? - Me poshtë, djathtas, tabela gjithashtu demonstron një veçim. - Edhe në këtë rast ajo mund të përfaqësojë fillimin e një tjetër grupimi vertikal (për shembull, një ndryshim në mënyra mund të ndodhë për vlerat y më të mëdha se 10. Për disa të dhëna, ka disa mënyra natyrore të prezantimit. Për shembull, të dhënat që kanë një komponent të dobishëm gjeografik, mund të vihen në funksion të plotë për t’u përfaqësuar si shënues në një hartë, ose datat kalendarike ose vargjet të cilat mund të zbulojnë modele interesante, të tilla si copëtime, apo mbivendosje, kur shfaqen në një afat kohor.

OKF timeliner toolkit ofron një mënyrë të lehtë për të prodhuar lidhjet në një afat kohor parë nga të dhënat që përmbahen në tabelat e Google. MIT /Projekti i Ngjashëm Timemap gjithashtu ju lejon t’i  shihni këto të dhëna të përmbajtura në tabelat e Google-it, në hartën e lidhur dhe në afatin e duhur kohor. CartoDB ju ofron një mjedis të fuqishëm në internet për t’i gjeneruar hartat tuaja.

Simbolet me ngjyrë ose përmasa të ndryshme mund të përdoren për të përfaqësuar madhësi të ndryshme nga vendndodhja gjeografike, edhe pse kujdesi duhet të merret për të siguruar që përshkrime të tilla nuk ndjekin shpërndarjen e popullsisë.

http://xkcd.com/1138/

Nëse keni lejehyrjeje në të dhënat deri në kufijtë e dosjeve, rajonet mund të errësohen sipas madhësisë numerike lidhur me rajonin duke përdorur hartën choropleth (hartë gjeografike e ngjyrosur me zona të errëta që përdoret për matjen e dendësisë së popullsisë apo të ardhurave për frymë), si në këtë shembull të Harta e Mirëqenies së Fëmijëve në Distriktin e Kolumbisë.

Analiza vizuale gjithashtu mund të ofrojë njohuri rreth përsëritjes së modeleve që ndodhin përgjatë serisë kohore tek të dhënat. Për shembull, nënndarjet sezonale në copëza, apo cikël subjektesh, të cilat zbulojnë jo vetëm mënyrat e modeleve në të gjitha ditët e javës, për shembull, por edhe për një ditë të veçantë mbi një seri prej javësh apo muajsh, siç përshkruhet në Introduction to Cycle Plots (Hyrje në cikle subjektesh).

Përderisa pjesët e tabelave mund të përdoren për të parë se si “një tërësi” mund të ndahet në pjesë të ndryshme - për shembull, si një buxhet mund të ndahet në zona të ndryshme shpenzuese -  një formë më e fuqishme e tabelës që tregon si një hartë pemë mund të përdoret për të prezantuar të njëjtin informacion në një mënyrë shumë intuitive, siç demonstrohet në OpenSpending.org 

Tree map

Prezantimet mundet gjithashtu të mbështesin pamjet e mbivendosura mbi tërë të dhënat, duke e trajtuar secilën zonë të hartës pemë si një hartë pemë me të drejtën e vet. Për shembull, një hartë pemë mbi zonat e shpenzimeve, mund të ndahet për çdo zonë të shpenzimeve në projekte  individuale apo buxhete brenda asaj zone shpenzuese. Duke vënë paksa në përdorim kreativitetin, stili i hartës pemë prezanton gjithashtu mënyrën e përdorimit dhe eksplorimit të strukturave organizative. Për shembull, ne mund të përshkruajmë komisionet që operojnë brenda në parlament, duke theksuar rëndësinë e madhësisë së secilit prej komisioneve, bazuar në numrin e anëtarëve të tyre, dhe të ndajmë anëtarësinë e secilit komision në bazë të përkatësive partiake. Ose brenda një zone lokale të këshillit, ne mund të përshkruaj se sa vota ishin hedhur për secilin kandidat, me ngjyrë partie, brenda secilës ndarje zgjedhore.

Për të analizuar marrëdhëniet midis njerëzve apo gjërave, rrjetet vizuale sigurojnë një pamje mbi të dhënat që tregojnë jo vetëm se sa elementë të pavarur lidhen me njëri-tjetrin, por gjithashtu edhe se si ata janë të grupuar në bazë sa më të mirë për t’u lidhur me njëri-tjetrin.

 

Gjërat kryesore për të parë në një rrjet vizual janë nyjet që kanë një numër të madh të lidhjeve me nyjet e tjera, apo nyjet që veprojnë si ura ndërmjet grupeve të dallueshme në të kundërt me nyjat që kanë lidhje të shumta. Aplikacioneve interaktive të rrjeteve vizuale të tilla si Gephi apo aplikimit NodeXL spreadsheet application, sigurojnë mjete për drejtimin e rrjetit të statistikave dhe pastaj dukjen e rezultateve. Flukset midis organizatave mundet gjithashtu të prezantohen vizualisht si diagrame që përfaqësojnë shpenzimet nga disa këshilla me anëtarët e grupimeve të veçanta.

Në këtë rast, ne mund të shohim se si fluksi i parave, për shembull, bëhet i koncentruar, apo nëse janë “të pazakonshme” shtigjet se paratë mund të ‘rrjedhin’ së bashku. Siç e keni vënë re, analiza vizuale mund të na japë një gamë të fuqishme të mjeteve për bërjen të dukshme të të dhënave, të vendosura në atë mënyrë që na lejon pastaj të fillojmë të ngremë pyetje rreth saj dhe të nisim të kërkojmë e të marrin përgjigje në një mënyrë grafike. Për sa kohë disa nga tabelat mund të jenë shumë të ndërlikuara për t'u përdorur për qëllime prezantimi, ato mund të jenë një përdorim i shkëlqyer për pjesën më të madhe të hetuesve në procese investigative.

Photo in this article was published by JD Hancock  on FLICKR under a CC BY 2.0 License

Data

10/17/2013 - 15:53