Spočítajte počet slov v súbore pomocou príkazu "Wc"

Príkaz Linux "wc" môže byť použitý na poskytnutie celkového počtu slov, ktoré sú v súbore. Je to užitočné, ak sa pokúšate vstúpiť do súťaže, ktorá vyžaduje maximálny počet slov, alebo ak ste študent s minimálnou požiadavkou na limit slova na esej.

V skutočnosti to funguje len dobre na textových súboroch, ale LibreOffice poskytuje možnosť "count count" v ponuke "tools", ak potrebujete počítať slov z dokumentu s bohatým textom, ako je dokument Word, dokument OpenOffice alebo súbor s bohatým textom.

Ako používať príkaz "wc"

Základné použitie príkazu "wc" je nasledovné:

wc

Napríklad máme súbor nazvaný test.txt s nasledujúcim obsahom:

Moje esej
nadpis
Mačka sedela na podložke

Ak chcete zistiť počet slov v tomto súbore, môžeme použiť nasledujúci príkaz:

wc test.txt

Výstup z príkazu "wc" je nasledovný:

3 9 41 test.txt

Hodnoty sú nasledujúce:

Získajte celkový počet slov z viacerých súborov

Môžete poskytnúť viaceré názvy súborov príkazu "wc", ako keď získate počítanie pre každý súbor a celkový riadok.

Na to sme skopírovali súbor test.txt a nazvali ho test2.txt. Ak chcete získať počet slov oboch súborov, mohli by sme spustiť nasledujúci príkaz:

wc test.txt test2.txt

Výstup je nasledovný:

3 9 41 test.txt

3 9 41 test2.txt

6 18 82 celkom

Rovnako ako prvé číslo na každom riadku je počet riadkov, druhé číslo je počet slov a tretie číslo celkový počet bajtov.

K dispozícii je ďalší prepínač, ktorý je trochu divný v mene a skutočne funguje pomerne zvláštne.

Príkaz vyzerá takto:

wc --files0-od = -

(To je nula po súboroch slov)

Pri spustení vyššie uvedeného príkazu uvidíte kurzor a môžete zadať názov súboru. Po zadaní názvu súboru stlačte CTRL a D dvakrát. Zobrazia sa súčty pre tento súbor.

Teraz môžete zadať iný názov súboru a stlačiť CTRL D dvakrát. Zobrazia sa súčty z druhého súboru.

Môžete to pokračovať, kým nebudete mať dosť. Stlačením kombinácie klávesov CTRL a C opustíte späť hlavný príkazový riadok.

Rovnaký príkaz možno použiť na vyhľadanie počtu slov všetkých textových súborov v priečinku takto:

Nájsť . -typ f -print0 | wc -l --files0-od = -

To kombinuje príkaz find s príkazom count count. Príkaz find nájde v aktuálnom adresári (označený znakom.) Pre všetky súbory s typom súboru a potom vytlačí meno s nulovým znakom, ktorý je vyžadovaný príkazom wc. Príkaz wc zadá vstup a spracuje každý názov súboru vrátený príkazom find.

Ako zobraziť len celkový počet bajtov v súbore

Ak chcete len získať počet bajtov v súbore, môžete použiť nasledujúci príkaz:

wc -c

Tým sa vráti celkový počet bajtov a názov súboru.

Ako zobraziť len celkový počet znakov v súbore

Počet bajtov je zvyčajne o niečo vyšší ako celkový počet znakov v súbore.

Ak chcete len celkový počet znakov, môžete použiť nasledujúci príkaz:

wc -m

Pre súbor test.txt je výstup 39 a nie 41 ako predtým.

Ako zobraziť len celkový počet riadkov v súbore

Môžete spustiť nasledujúci príkaz na vrátenie len celkového počtu riadkov v súbore:

wc -l

Ako zobraziť najdlhší riadok v súbore

Ak chcete vedieť najdlhší riadok v súbore, môžete spustiť nasledujúci príkaz:

wc -L

Ak spustíte tento príkaz proti súboru "test.txt", výsledok je 22, čo zodpovedá počtu znakov pre riadok "Mačka sedela na podložke".

Ako zobraziť len celkový počet slov v súbore

V neposlednom rade môžete získať celkový počet slov v súbore spustením nasledujúceho príkazu:

wc -w