Despre RAMSAN – pe înțelesul tuturor

RAMSAN este o soluție hardware la o problemă foarte mare din IT, în special acolo unde se lucrează cu baze de date de dimensiuni mari. Ideea e ca un sistem de calcul are următoarele resurse principale care sunt intotdeauna limitate:

  • Procesor;
  • Memorie;
  • I/O = input/output – spre memorie permanentă așa cum este tradiționalul HDD.

Conform teoriei cozilor, atunci când creşti încărcarea pe sistem, resursele cele mai limitate încep să intre în deficienţă și induc bucle mari de întârziere în efectuarea chiar și a celor mai simple calcule. În cazul nostru, întotdeauna una din cele trei resurse menționate mai sus va fi deficientă.

Când te uiţi pe Task Manager la Performance, vezi grafice pentru procesor şi pentru memorie, dar nu vezi și unele pentru disc. În sistemele moderne există și panouri de perfornanță I/O dar ele sunt mai mereu ciudate și greu de interpretat. Ca o regulă simplă, valabilă în cele mai multe dintre situații, atunci când nici procesorul, nici memoria nu sunt foarte încărcate (peste 80%) înseamnă ca eşti în una din situaţiile următoare:

  • Fie nu faci mai nimic cu acel computer,
  • Fie îngustarea de performanţă este la I/O.

La calculatorul de acasă e normală prima variantă, într-un centru de calcul e normală a doua.

Una din marile probleme este că unii administratori de sisteme folosesc aplicații de măsură a performanței dezvoltate cu utilizatorul casnic în minte pentru a măsura sisteme de stocare din gama enterprise. Din nefericire nu numai că nu se simulează corect încărcarea dintr-un centru de calcul dar chiar și interpetările sunt de multe ori aberant de aplicat la contextul unui centru de calcul.

Lăsând la o parte priceperea sau nepriceperea utilizatorilor, producătorii sunt foarte conștienți de aceste probleme. În decursul anilor ei au făcut multe lucruri să îmbunătăţească viteza discurilor dure (paralelizare, memorii cache etc.), dar un anumit element nu poate fi depăşit: faptul că, în mod mecanic, capul de citire trebuie mutat în diverse poziţii, face ca între momentul unei cereri şi cel al primirii răspunsului să treacă un timp mare (>5 ms).

Dacă trimiţi un film pe reţea şi fişierul e defragmentat, atunci mişti capul o dată şi trimiţi filmul de 90 de minute fără să mai faci mişcări prea mari – în cazul ăsta nu e mare scofală decât dacă trebuie să trimiţi acelaşi film la mai mulţi deodată şi capul începe să se mişte la poziţia necesară fiecărui client.

Dacă procesezi tranzacţii de cărţi de credit ca bancă, ai foarte multe tranzacţii foarte mici şi foarte des solicitate. Capul hard-discului trebuie mişcat aleatoriu mai mereu.

Asta e o explicaţie în mic; în mare lucrurile stau mai bine când pui 500 de hard-discuri şi foarte mult cache DAR la un sistem stresat rămâi în găleată cu cele 5 ms la acces aleatoriu.

RAMSAN fiind bazat fie pe memorie RAM, fie FLASH, nu are probleme de mecanică. Timpii de latenţă sunt foarte mici şi poţi face multe tranzacţii pe secundă, deci poţi să foloseşti un singur computer la capacităţi mai mari de încărcare a procesoarelor şi memoriei proprii. În plus, toată arhitectura e potrivită pentru siguranţa şi performanţa care se aşteaptă într-un centru de calcul serios. Nu putem compara 120 GB de RAMSAN cu 120 GB de disk flash tocmai lansat de Intel pentru laptopuri.

Citirea fișelor tehnice ale produselor de stocare din mediul enterprise este un alt lucru care trebuie făcut cu multă atenție. Trebuie mereu să ținem minte că ele sunt scrise mai întâi cu scopul de a face profit și apoi cu scopul de a ajuta beneficiarul. Mulți parametrii sunt ignorați în timp ce alții sunt supraevaluați. De exemplu latența este mai mereu trecută sub tăcere (și e cel mai important parametru pentru tranzacții OTLP) în timp ce se marjează puternic pe un număr IOPS cât mai mare. Dar să nu comparăm mere cu pere.

Totul se reduce la bani: cât te costă să efectuezi un număr de tranzacţii pe secundă? Sau cât te costă o tranzacţie / secundă după ce investeşti banii? Calculezi tot, servere, procesoare şi sisteme de stocare şi backup, software şi servicii de mentenanţă şi de operare ca să obţii performanţa minimă cerută de business după care împarţi costurile la numărul de tranzacţii pe secundă obţinute efectiv în mediul tău de producţie.

Ideea cu multe HDD ar merge, poţi face acele tranzacţii, dar în loc să plăteşti de ex. 200.000 de Euro pe un sistem complet, ajungi şi la 2.000.000 de Euro şi cu cheltuieli anuale mult mai mari.

Desigur, să ţii volume mari de date inerte pe RAMSAN e scump, încă avem nevoie de HDD pentru asta, însă datele foarte volatile merită să fie stocate pe un mediu corespunzător vitezei lor de tranzacţionare.

Datorită uriașelor eforturi de a împinge pe piață soluțiile tehnice tradiționale în detrimentul celor noi – vezi controversa petrol – energie neconvențională – și în ceea ce privește sistemele de stocare teoria se lasă greu înţeleasă și numai de către puţini, chiar și dintre cei care se confruntă în mod real cu problemele amintite mai sus. Până acum eu personal nu am mai întâlnit un segment de piaţă IT în care să fie atât de dificil să convingi pe cineva de un adevăr simplu.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *