Arhiva etichetelor: analiza datelor

Unelte pentru BigData și Data Mining

De curând am testat o unealtă de date mining despre care vreau să vă povestesc astăzi.
Aplicația se numește Datameer și este una de tip cloud bazata pe Hadoop.
Nu trebuie să instalăm nimic pe calculator, însă trebuie să avem datele pe care vrem să le analizăm.

Pasul 1: Importarea datelor

Pentru a importa datele trebuie să selectam formatul în care acestea sunt reprezentate

datameer 0

Pasul 2: Câteva mici configurări

Unele dintre ele țin de formatul datelor, altele de modul de detecție a tipurilor de date. Programul încearcă să detecteze tipul fiecărei coloane. Dealtfel se pot adaugă tipurile de date dintr-un fișier.

datameer 0.1

Pasul 3: Reglaje fine

Dacă programul nu reușește să detecteze bine coloanele putem sa le introducem noi manual. Un minus al programului este reprezentat de faptul că nu putem ajusta datele în acest pas decât prin eliminarea înregistrărilor care nu corespund tipurilor de date definite de utilizator.
datameer 1

Pasul 4: Setarea eșantionului care este folosit pentru previzualizarea operațiilor

datameer2

Cam ăsta a fost tot procesul prin care se adaugă datele în datameer.
Mai departe apare o interfață asemănătoare cu Excel în care vedem datele noastre.
Avem în plus câteva butoane care sunt responsabile pentru toată magia:

Column Dependency
Practic putem vedea dacă există legături între diferite coloane. Putem vedea dacă o variabilă este influențată de alta.

Clustering
Putem grupa datele după asemănarea lor.
Toată partea de descoperire a asemănărilor o face programul, noi trebuie doar sa spunem numărul de grupuri pe care vrem sa îl obținem.

Decision tree
Construiește un arbore de decizie pe baza datelor noastre.

Cam acestea sunt funcțiile magice pe care le are Datameer, dar adevărata putere a programului nu este reprezentata de funcții în sine, ci abilitatea acestuia de a le rula pe cantități uriașe de date.

Google Analytics

Google Analytics este una din cele mai folosite unelte pentru monitorizarea vizitelor siteurilor proprii. Asta înseamnă ca Google Analytics ne permite să vedem câți vizitatori a avut siteul nostru în fiecare zi, de unde au venit ei (de pe ce siteuri), cât au stat ei la noi pe site și multe alte informații utile.

Cum funcționează?

Adaugăm un cod pe siteul nostru, iar acest cod se execută la fiecare vizita a unui utilizator. Astfel ajung date despre vizite și vizitatori în Google Analytics unde le putem vedea și analiza.

De ce este Google Analytics așa popular?

Google Analytics este o unealtă gratuită și accesibilă pentru oricine are un website. De altfel această unealtă de monitorizare are câteva instrumente foarte puternice pentru analiză.

Puteți vedea aici: cum am folosit Google Analytics pentru a optimiza siteul nostru.

Unde îl găsesc?

Aici :)

Despre analiza datelor

De cele mai multe ori motivul pentru care strângem date este ca să aflam diferite informații. Drumul acesta de la datele colectate la informații utile se numește analiză datelor sau data mining atunci când sunt necesare operații de prelucrare mai complexe.

Astăzi o sa dau ca exemplu o situație cu care ne-am confruntat noi de curând:

Folosind Google Analytics am observat ca doar 10% din cei care ajungeau pe blogul nostru, ajungeau și pe site.

Capture

Soluția a fost simplă: Am adăugat în meniu un buton (foarte vizibil) către siteul nostru.

Rezultatul: Am reușit să dublam rata de vizitatori care ajung în site din blogul nostru.

Acesta este doar un exemplu foarte simplu de situație în care putem lua decizii pe baza rezultatelor unei analize.