Ekstrak semua URL menggunakan sup dan python3 yang indah

Ekstrak semua URL menggunakan sup dan python3 yang indah

Pautan berikut akan mengekstrak semua URL untuk laman web yang diberikan.

#!/usr/bin/env python3 # Python Versi: 3.4.2 # BS4 Versi: 4.3.2-2 dari Urllib.minta import urlopen dari bs4 import html cantik = urlopen ("http: // gnu.org ") # masukkan url anda untuk mengekstrak bsobj = BeautifulSoup (html.Baca ()); untuk pautan dalam bsobj.find_all ('a'): Cetak(Pautan.dapatkan ('href'))

Simpan skrip di atas ke dalam fail misalnya. Ekstrak-url.py dan menjadikannya boleh dilaksanakan:

$ chmod +x ekstrak-url.py 

Jalankan skrip:

$ ./Extract-URL.py 

Tutorial Linux Berkaitan:

  • Cara Membina Aplikasi TKInter Menggunakan Objek Berorientasikan ..
  • Cara Bekerja Dengan API Rest WooCommerce dengan Python
  • Cara Menyiapkan Pelayan OpenVPN di Ubuntu 20.04
  • Muat turun fail dari URL di linux menggunakan baris arahan
  • Pengenalan kepada Automasi, Alat dan Teknik Linux
  • Perkara yang hendak dipasang di Ubuntu 20.04
  • Cara Menetapkan Program Lalai Menggunakan Kemas Kini-Alternatif pada ..
  • Cara membaca dan membuat fail CSV menggunakan python
  • Cara Mengikis laman web dari baris arahan menggunakan HTMLQ
  • Cara Menulis Sambungan Nautilus dengan Nautilus-Python