Ekstrak semua URL menggunakan sup dan python3 yang indah
- 3923
- 279
- Clarence Tromp
Pautan berikut akan mengekstrak semua URL untuk laman web yang diberikan.
#!/usr/bin/env python3 # Python Versi: 3.4.2 # BS4 Versi: 4.3.2-2 dari Urllib.minta import urlopen dari bs4 import html cantik = urlopen ("http: // gnu.org ") # masukkan url anda untuk mengekstrak bsobj = BeautifulSoup (html.Baca ()); untuk pautan dalam bsobj.find_all ('a'): Cetak(Pautan.dapatkan ('href'))
Simpan skrip di atas ke dalam fail misalnya. Ekstrak-url.py
dan menjadikannya boleh dilaksanakan:
$ chmod +x ekstrak-url.py
Jalankan skrip:
$ ./Extract-URL.py
Tutorial Linux Berkaitan:
- Cara Membina Aplikasi TKInter Menggunakan Objek Berorientasikan ..
- Cara Bekerja Dengan API Rest WooCommerce dengan Python
- Cara Menyiapkan Pelayan OpenVPN di Ubuntu 20.04
- Muat turun fail dari URL di linux menggunakan baris arahan
- Pengenalan kepada Automasi, Alat dan Teknik Linux
- Perkara yang hendak dipasang di Ubuntu 20.04
- Cara Menetapkan Program Lalai Menggunakan Kemas Kini-Alternatif pada ..
- Cara membaca dan membuat fail CSV menggunakan python
- Cara Mengikis laman web dari baris arahan menggunakan HTMLQ
- Cara Menulis Sambungan Nautilus dengan Nautilus-Python
- « Pemasangan Alat Perintah S3CMD Amazon S3 di Debian Linux
- Bash Shellshock Bug Linux Sistem Ujian Kerentanan »