Cara Memasang dan Konfigurasi Hive Dengan Ketersediaan Tinggi - Bahagian 7
- 4530
- 1125
- Ronnie Hermann
Sarang ialah Gudang Data model dalam Hadoop Sistem Eco. Ia boleh dilakukan sebagai alat ETL di atas Hadoop. Membolehkan ketersediaan tinggi (HA) di sarang tidak serupa seperti yang kita lakukan dalam perkhidmatan induk seperti Namenode dan Pengurus Sumber.
Failover automatik tidak akan berlaku di Sarang (Hiveserver2). Jika ada Hiveserver2 (HS2) gagal, menjalankan pekerjaan pada yang gagal HS2 akan gagal. Kita perlu menyerahkan semula pekerjaan itu supaya pekerjaan dapat berjalan di lain -lain Hiveserver2. Jadi, membolehkan Ha pada HS2 tidak lain tetapi meningkatkan jumlah HS2 komponen dalam Kelompok.
Dalam artikel ini, kita akan melihat langkah -langkah untuk memasang dan membolehkan Ketersediaan tinggi dari Sarang.
Keperluan
- Amalan Terbaik untuk Menggunakan Hadoop Server di CentOS/RHEL 7 - Bahagian 1
- Menyediakan prasyarat Hadoop dan pengerasan keselamatan - Bahagian 2
- Cara Memasang dan Mengkonfigurasi Pengurus Cloudera di CentOS/RHEL 7 - Bahagian 3
- Cara Memasang CDH dan Konfigurasikan Penempatan Perkhidmatan di CentOS/RHEL 7 - Bahagian 4
- Cara Menyediakan Ketersediaan Tinggi Untuk Namenode - Bahagian 5
- Cara Menyediakan Ketersediaan Tinggi Untuk Pengurus Sumber - Bahagian 6
Mari kita mulakan…
Pemasangan dan konfigurasi sarang
1. Log masuk ke Pengurus Cloudera di URL di bawah dan menavigasi ke Pengurus Cloudera -> Tambah perkhidmatan.
http: // 13.233.129.39: 7180/cmf/rumahTambahkan Perkhidmatan dalam Pengurus Cloudera
2. Pilih perkhidmatan 'Sarang'.
Pilih Perkhidmatan Hive3. Berikan perkhidmatan pada nod.
- Gateway - Ia adalah perkhidmatan pelanggan di mana pengguna dapat mengakses sarang. Biasanya, perkhidmatan ini akan diletakkan Hujung nod yang didedikasikan kepada pengguna.
- Hive Metastore - Ia adalah repositori pusat untuk menyimpan metadata sarang.
- Pelayan webhcat - Ia adalah API web untuk hcatalog dan perkhidmatan hadoop lain.
- Hiveserver2 - Ini adalah antara muka pelanggan untuk pelaksanaan pertanyaan di sarang.
Setelah memilih pelayan, klik 'Teruskan'Untuk meneruskan.
Memberikan perkhidmatan sebagai nod4. Hive Metastore memerlukan pangkalan data asas untuk menyimpan metadata. Di sini kita menggunakan lalai PostgreSQL pangkalan data yang dibina dengan Cdh.
Butiran pangkalan data yang disebutkan di bawah akan dimasukkan secara automatik, 'Sambungan ujian'akan dilangkau kerana pangkalan data yang disebutkan akan dibuat dengan cepat. Dalam masa nyata, kita perlu membuat pangkalan data dalam pangkalan data luaran dan menguji sambungan untuk meneruskan lebih lanjut. Setelah selesai, sila klik 'Teruskan'.
Pangkalan data persediaan5. Konfigurasikan Hive Warehouse direktori, /pengguna/sarang/gudang adalah laluan direktori lalai untuk menyimpan jadual sarang. Klik 'Teruskan'.
Pilih Direktori Gudang Hive6. Pemasangan Hive dimulakan.
Kemajuan pemasangan sarang7. Setelah pemasangan selesai, anda boleh mendapatkan 'Selesai'Status. Klik 'Teruskan'Untuk meneruskan lebih jauh.
Pemasangan sarang selesai8. Pemasangan dan konfigurasi sarang berjaya diselesaikan. Klik 'Selesai'Untuk menyelesaikan prosedur pemasangan.
Selesaikan pemasangan sarang9. Anda dapat melihat Sarang perkhidmatan ditambah dalam Kelompok melalui Dashboard Pengurus Cloudera.
Perkhidmatan Hive ditambah10. Anda boleh melihat Hiveserver2 dalam Contoh dari Sarang. Kami telah menambah Hiveserver2 dalam Master1.
Pengurus Cloudera -> Sarang -> Contoh -> Hiveserver2.
Lihat contoh Hiveserver2Membolehkan ketersediaan tinggi di sarang
11. Seterusnya menambah peranan sarang dengan pergi Pengurus Cloudera -> Sarang -> Tindakan -> Tambah peranan Contoh.
Tambahkan contoh peranan sarang12. Pilih pelayan di mana anda ingin meletakkan tambahan Hiveserver2. Anda boleh menambah lebih daripada dua, tidak ada had. Di sini kami menambah tambahan Hiveserver2 dalam Master2.
Pilih Pelayan untuk Hive Pilih pelayan tuan rumah13. Setelah memilih pelayan, klik 'Teruskan'.
Pelayan ditambahkan14. A Hiverserver2 akan dimasukkan ke dalam Contoh sarang, anda perlu memulakannya dengan pergi Pengurus Cloudera -> Sarang -> Contoh -> (Pilih Hiveserver2 ditambah baru) -> Tindakan untuk dipilih -> Mula.
Pilih pelayan sarang Mulakan pelayan sarang Mulakan pelayan sarang15. Sekali Hiveserver2 Bermula Master2, anda akan mendapat status 'Selesai'. Klik Tutup.
Status selesai16. Anda boleh melihat, kedua -duanya Hiveserver2s sedang berjalan.
Sahkan status pelayan sarangMengesahkan ketersediaan sarang
Kita boleh menyambungkan Hiveserver2 melalui beeline yang merupakan pelanggan nipis dan baris arahan. Ia menggunakan pemandu JDBC untuk menubuhkan sambungan.
17. Log masuk ke pelayan di mana Hive Gateway adalah berlari.
[[dilindungi e -mel] ~] $ beelineSambung ke Hiveserver2
18. Masuk ke JDBC rentetan sambungan untuk menyambung Hiveserver2. Dalam hubungan ini, tali Kami menyebutkan Hiverserver2 (Master2) dengan nombor port lalainya 10000. Rentetan sambungan ini hanya akan menyambung ke Hiveserver2 yang sedang berjalan Master2.
beeline> !Sambung "JDBC: Hive2: // Master1.Tecmint.com: 10000 "String sambungan JDBC
19. Jalankan pertanyaan contoh.
0: JDBC: Hive2: // Master1.Tecmint.com: 10000> menunjukkan pangkalan data;Jalankan pertanyaan sampel
Ini adalah pangkalan data lalai yang dibina.
20. Gunakan arahan di bawah untuk menamatkan sesi sarang.
0: JDBC: Hive2: // Master1.Tecmint.com: 10000> !berhentiBerhenti sesi sarang
21. Anda boleh menggunakan cara yang sama untuk disambungkan Hiveserver2 Berlari Master2.
beeline> !Sambung "JDBC: Hive2: // Master2.Tecmint.com: 10000 "Sambungkan ke pelayan sarang
23. Kita boleh menyambungkan Hiveserver2 dalam Penemuan Zookeeper mod. Dalam kaedah ini, kita tidak perlu menyebutnya Hiveserver2 dalam rentetan sambungan sebaliknya kita menggunakan Penjaga zoo Untuk mengetahui yang ada Hiveserver2.
Di sini kita boleh menggunakan pengimbang beban pihak ketiga untuk mengimbangi beban di antara yang ada Hiverserver2. Konfigurasi di bawah adalah perlu membolehkan Mod Penemuan Zookeeper dengan pergi ke Pengurus Cloudera -> Sarang -> Konfigurasi.
Dayakan mod penemuan zookeeper24. Seterusnya, cari harta itu "Coretan Konfigurasi Lanjutan Hiveserver2"Dan klik +
simbol untuk menambah harta di bawah.
Nama: sarang.Server2.sokongan.dinamik.perkhidmatan.Nilai Penemuan: Penerangan Benar:Coretan Konfigurasi Lanjutan Hiveserver2
25. Setelah memasuki harta benda, klik 'Simpan perubahan'.
Tambah harta26. Semasa kami membuat perubahan kepada konfigurasi, perlu memulakan semula perkhidmatan yang terjejas dengan mengklik simbol warna oren untuk memulakan semula perkhidmatan.
Memulakan semula perkhidmatan27. Klik 'Mulakan semula basi'Perkhidmatan.
Mulakan semula perkhidmatan basi28. Terdapat dua pilihan yang ada. Sekiranya kelompok dalam pengeluaran secara langsung, kita perlu lebih suka memulakan semula untuk meminimumkan gangguan. Seperti yang kita baru memasang, kita boleh memilih pilihan kedua 'Menggunakan semula konfigurasi pelanggan', dan klik'Mulakan semula sekarang'.
Menggunakan semula konfigurasi pelanggan29. Setelah mulakan semula selesai, anda akan mendapat status 'Selesai'. Klik 'Selesai'Untuk menyelesaikan proses.
Menyelesaikan proses30. Sekarang kita akan menghubungkan Hiveserver2 menggunakan Penemuan Zookeeper mod. Di dalam JDBC sambungan, rentetan yang kita perlukan untuk menggunakan Penjaga zoo pelayan dengan nombor portnya 2081. Kumpulkan pelayan Zookeeper dengan pergi ke Pengurus Cloudera -> Penjaga zoo -> Contoh -> (Perhatikan nama pelayan).
Pelayan zookeeperIni adalah tiga pelayan yang mempunyai zookeeper, 2181 adalah nombor port.
Master1.Tecmint.com: 2181 Master2.Tecmint.com: 2181 pekerja1.Tecmint.com: 2181
31. Sekarang masuk Beeline.
[[dilindungi e -mel] ~] $ beelineSambung ke Beeline
32. Masuk ke JDBC rentetan sambungan seperti yang disebutkan di bawah. Kita mesti menyebutnya Mod Penemuan Perkhidmatan dan Ruang nama Zookeeper. 'Hiveserver2'adalah ruang nama lalai Hiveserver2.
beeline>!Sambung "JDBC: Hive2: // Master1.Tecmint.com: 2181, master2.Tecmint.com: 2181, pekerja1.Tecmint.com: 2181/; ServiceDiscoveryMode = Zookeeper; ZookeeperNamesPace = Hiveserver2 "Masukkan rentetan sambungan jdbc
33. Sekarang sesi disambungkan ke Hiveserver2 Berlari Master1. Jalankan pertanyaan sampel untuk mengesahkan. Gunakan arahan di bawah untuk membuat pangkalan data.
0: JDBC: Hive2: // Master1.Tecmint.com: 2181, MAST> Buat pangkalan data Tecmint;Buat pangkalan data
34. Gunakan arahan di bawah untuk menyenaraikan pangkalan data.
0: JDBC: Hive2: // Master1.Tecmint.com: 2181, tiang> menunjukkan pangkalan data;Senarai pangkalan data
35. Sekarang kita akan mengesahkan ketersediaan tinggi di Mod Penemuan Zookeeper. Pergi ke Pengurus Cloudera dan hentikan Hiveserver2 pada Master1 bahawa kami telah diuji di atas.
Pengurus Cloudera -> Sarang -> Contoh -> (pilih Hiveserver2 pada Master1) -> Tindakan untuk dipilih -> Berhenti.
Pilih pelayan sarang Hentikan pelayan sarang36. Klik 'Berhenti'. Setelah berhenti, anda akan mendapat status 'Selesai'. Sahkan Hiveserver2 pada Master1 dengan menavigasi ke Sarang -> Contoh.
Hentikan pelayan sarang Sahkan pelayan sarang37. Masuk ke dalam Beeline dan sambungkan Hiveserver2 menggunakan yang sama JDBC rentetan sambungan dengan Mod Penemuan Zookeeper seperti yang kita lakukan dalam langkah -langkah di atas.
[[dilindungi e -mel] ~] $ beeline beeline>!Sambung "JDBC: Hive2: // Master1.Tecmint.com: 2181, master2.Tecmint.com: 2181, pekerja1.Tecmint.com: 2181/; ServiceDiscoveryMode = Zookeeper; ZookeeperNamesPace = Hiveserver2 "Sambungkan Hiveserver2
Sekarang anda akan dihubungkan dengan Hiveserver2 Berlari Master2.
38. Sahkan dengan pertanyaan sampel.
0: JDBC: Hive2: // Master1.Tecmint.com: 2181, tiang> menunjukkan pangkalan data;Mengesahkan pertanyaan sampel
Kesimpulan
Dalam artikel ini, kami telah melalui langkah -langkah terperinci untuk mempunyai Gudang data sarang Model dalam kami Kelompok dengan Ketersediaan tinggi. Dalam persekitaran pengeluaran masa nyata, lebih daripada tiga Hiveserver2 akan diletakkan dengan Mod Penemuan Zookeeper didayakan.
Di sini, semua Hiveserver2's sedang mendaftar dengan Penjaga zoo di bawah umum Ruang nama. Zookeeper secara dinamik mendapati yang ada Hiveserver2 dan menetapkan sesi sarang.
- « Cara Memasang Workstation VMware 16 Pro di Linux Systems
- Cara Memasang Kluster Kubernet di CentOS 8 »