Parsing File Teks Dengan Perl

Parsing file teks adalah salah satu alasan Perl membuat alat penambangan data dan skrip yang hebat.

Seperti yang akan Anda lihat di bawah, Perl pada dasarnya dapat digunakan untuk memformat ulang sekelompok teks. Jika Anda melihat ke bawah pada potongan teks pertama dan kemudian bagian terakhir di bagian bawah halaman, Anda dapat melihat bahwa kode di tengah adalah apa yang mengubah set pertama menjadi yang kedua.

Cara Mengurai File Teks

Sebagai contoh, mari kita membangun sebuah program kecil yang membuka file data yang dipisahkan tab, dan mem-parsing kolom menjadi sesuatu yang bisa kita gunakan.

Katakan, sebagai contoh, bahwa atasan Anda memberi Anda file dengan daftar nama, email, dan nomor telepon, dan ingin Anda membaca file dan melakukan sesuatu dengan informasi, seperti memasukkannya ke dalam database atau hanya mencetaknya dalam format yang baik melaporkan.

Kolom file dipisahkan dengan karakter TAB dan akan terlihat seperti ini:

 Larry [email protected] 111-1111

 Curly [email protected] 222-2222

 Moe [email protected] 333-3333 

instagram viewer

Inilah daftar lengkap yang akan kami tangani:

 #! / usr / bin / perl


 buka (FILE, 'data.txt');

 sementara () {

 chomp;

 ($ name, $ email, $ phone) = split ("\ t");

 print "Name: $ name \ n";

 cetak "Email: $ email \ n";

 cetak "Telepon: $ telepon \ n";

 cetak "\ n";

 }

 tutup (FILE);

 keluar;


catatan: Ini menarik beberapa kode dari tutorial aktif cara membaca dan menulis file dalam Perl.

Yang dilakukan pertama kali adalah membuka a mengajukan disebut data.txt (yang seharusnya berada di direktori yang sama dengan skrip Perl). Kemudian, ia membaca file ke dalam variabel catchall $ _ baris demi baris. Dalam hal ini, $ _ adalah tersirat dan tidak benar-benar digunakan dalam kode.

Setelah membaca dalam satu baris, spasi apa pun adalah chomped dari ujungnya. Kemudian, fungsi split digunakan untuk memecah garis pada karakter tab. Dalam hal ini, tab diwakili oleh kode \ t. Di sebelah kiri tanda pemisahan, Anda akan melihat bahwa saya menetapkan sekelompok tiga variabel berbeda. Ini mewakili satu untuk setiap kolom baris.

Terakhir, setiap variabel yang telah dipisahkan dari baris file dicetak secara terpisah sehingga Anda dapat melihat cara mengakses data setiap kolom secara terpisah.

Output skrip akan terlihat seperti ini:

 Nama: Larry

 Email: [email protected]

 Telepon: 111-1111


 Nama: Keriting

 Email: [email protected]

 Telepon: 222-2222


 Nama: Moe

 Email: [email protected]

 Telepon: 333-3333


Meskipun dalam contoh ini kami hanya mencetak data, akan mudah untuk menyimpan informasi yang sama yang diurai dari file TSV atau CSV, dalam basis data lengkap.

instagram story viewer