Procesarea fişierelor text foarte mari

La TheWebMiner avem deseori nevoie să procesam fișiere text foarte mari. Când spun foarte mari mă refer la fișiere mai mari de câteva sute de megabytes. Dintre toate editoarele care le-am testat până acum cel mai mine s-a descurcat Vim, respectiv gVim (versiunea de windows a faimosului editor).

Expresii regulate

Tot pentru procesarea fișierelor text folosim și expresii regulate (numite și RegEx). Expresii care ne ajută să căutăm (sau să căutăm și să înlocuim) porțiuni de text, care respecta un anumit format, într-om mod automat. Totul este frumos până ne lovim de următoarea problemă:

Cum folosim expresii regulate în Vim?

Vim are un format propriu pentru expresiile regulate așa că nu putem folosi expresii regulate standard în Vim, însă noi am creat un convertor special pentru asta. Convertorul îl puteți găsi aici: //thewebminer.com/regex-to-vim.

Sperăm să vă fie de folos acest articol.