kawan kali ini icha akan negebahas software cloudera untuk cloud computer
PENGERTIAN CLOUDERA
Cloudera
Inc adalah sebuah perusahaan yang berbasis di Amerika Alto perusahaan software
Palo yang menyediakan perangkat lunak Apache Hadoop berbasis , dukungan dan
layanan , dan pelatihan untuk didorong data perusahaan .
Open
source Apache Hadoop distribusi Cloudera itu , CDH ( Cloudera Distribusi
Termasuk Apache Hadoop ), menargetkan penyebaran kelas enterprise teknologi
itu. Cloudera mengatakan bahwa lebih dari 50 % dari output rekayasa
disumbangkan hulu ke berbagai Apache - berlisensi proyek open source ( Apache
Hive , Apache Avro , Apache HBase , dan sebagainya) yang menggabungkan untuk
membentuk platform Hadoop . Cloudera juga merupakan sponsor dari Apache
Software Foundation . pilihan Demonim untuk karyawan Cloudera adalah "
Clouderan .
TENTANG CLOUDERA
Cloudera adalah
pemimpin dalam Hadoop berbasis Apache perangkat lunak dan layanan dan
menawarkan platform data baru yang kuat yang memungkinkan perusahaan dan
organisasi untuk melihat semua data mereka - terstruktur serta terstruktur -
dan mengajukan pertanyaan yang lebih besar untuk wawasan belum pernah terjadi
sebelumnya pada kecepatan pikiran .
Cloudera adalah teknologi
start-up yang menyediakan tingkat perusahaan
produk dan layanan kepada
pengguna dari Apache Hadoop, terbuka populer
implementasi sumber
MapReduce, alat yang dirancang untuk mendalam
analisis data yang sangat
besar.
Mengapa Open Source Matters
Sejak dimulai
pada tahun 2008 , Cloudera telah sangat berkomitmen untuk berbasis masyarakat ,
open source Hadoop distribusi karena manfaat praktis bagi pelanggan .
Selain menawarkan
manfaat dari open source , Cloudera telah memimpin cara untuk bekerja dengan
pelanggan untuk memastikan bahwa kinerja mereka , ketersediaan , keamanan , dan
pemulihan kebutuhan terpenuhi dalam platform open source , dimulai dengan
keterlibatan pertama dengan Hadoop .
Keterlibatan yang
mendalam Cloudera dalam masyarakat Hadoop memastikan pelanggan mendapatkan
keuntungan dari keselarasan dekat roadmap open source dengan kebutuhan mereka -
dan mendapatkan ahli , dukungan proaktif dari orang-orang yang tahu platform
terbaik.
CHALLENGE
" Pemantauan cluster Hadoop kami
sangat penting untuk pengujian dan penyebaran Cloudera yang
Distribusi untuk Hadoop ( CDH ) ,
"jelas Alex Loddengaard , Software Engineer , Cloudera .
" Hal ini sangat penting bahwa
kita tahu mana mesin menurun, sehingga kami dapat memastikan kelompok kami
terus menjalankan pekerjaan batch
processing meskipun kegagalan . Kegagalan mesin atau daemon
turun dapat menyebabkan hilangnya
data. Tanpa pemantauan , ada kemungkinan bahwa kita akan
kehilangan data secara permanen . Selain
itu, downtime untuk cluster ini akan mengganggu kami
pengembangan kerja dengan memperlambat
tim engineering kami . Kita tidak bisa melewatkan rilis
tenggat waktu karena masalah perangkat
lunak perangkat keras atau . "
Hadoop menyimpan file besar yang berpisah
dan disimpan pada beberapa mesin yang berbeda .
Sebuah file terdiri dari beberapa
" blok " dan setiap blok direplikasi ke beberapa node .
Jika cukup node turun, data tidak bisa
diakses sampai mereka node datang kembali
up . Jika hard drive gagal , maka data
tersebut tidak mungkin dapat dipulihkan .
Hadoop digunakan untuk menyimpan ,
mengolah dan menganalisa dataset besar , dan menggunakan replikasi internal
yang
dan teknik toleransi kesalahan untuk
bertahan hidup kegagalan hardware dan software . Off-site backup
tidak praktis karena hanya ada terlalu
banyak data - puluhan , ratusan atau ribuan terabyte .
Karena itu, penting bahwa mesin dan
daemon dan berjalan terus ,
untuk menjamin ketersediaan data dan
reliabilitas, dan mencegah kehilangan data .
Loddengaard menambahkan bahwa
arsitektur Hadoop memiliki satu titik kegagalan, NameNode .
"Jika NameNode turun , itu
masalah besar karena semuanya akan berhenti , semua data akan
bisa diakses dan semua pekerjaan akan
gagal . Jadi itu benar-benar penting bahwa kita tahu kapan
NameNode turun , karena cluster akan
digunakan. "
larutan
Cloudera memutuskan cara terbaik untuk
mengatasi tantangan ini adalah untuk menyebarkan VMware
vFabric ™ Hyperic ® solusi pemantauan
. Loddengaard mengatakan bahwa beberapa alat yang baik memberikan
visibilitas sementara yang lain fokus
pada memperingatkan , namun unggul Hyperic di kedua daerah . memberitahukan
Hyperic
Staf Cloudera segera setiap kali mesin
atau daemon sedang down , atau ketika disk penuh
- Dan semua fungsi ini penting
disampaikan out-of -the-box dengan Hyperic .
MANFAAT
Hyperic memberikan hasil bisnis berikut untuk
Cloudera :
Tinggi Mesin Ketersediaan
" Hyperic memungkinkan kita untuk
memastikan ketersediaan mesin , dan pastikan berbagai batch processing
pekerjaan terus berjalan dengan benar
, "kata Loddengaard . " Dengan Hyperic , kita segera tahu
ketika mesin atau daemon turun . Di
Hadoop , satu-satunya cara bagi kita untuk otomatis
tahu jika mesin turun adalah dengan
menggunakan alat pemantauan seperti Hyperic . Jika tidak , uptime
akan secara signifikan lebih rendah ,
karena tidak ada cara lain yang baik untuk mendapatkan informasi tersebut.
"
" Jika kita tidak memiliki alat
pemantauan seperti Hyperic , teknisi kami akan kemungkinan besar akan
orang untuk memberitahu kami ketika
mesin sedang down , " ia menambahkan , " dan itu berarti perubahan
signifikan
untuk uptime kami . Kami akan pergi
dari 4 -9 yang kita dapatkan dengan Hyperic untuk 2 -9 atau bahkan 1-9 ,
tergantung pada berapa lama waktu
insinyur kami untuk memberitahu kami tentang masalah . "
Respon Cepat Waktu
Hyperic memberdayakan tim Cloudera
untuk segera merespon masalah ketersediaan .
Jika terpaksa bergantung pada insinyur
untuk mengidentifikasi mesin dan downtime daemon , tanpa
Hyperic , waktu respon Cloudera yang
bisa berjam-jam .
cepat Mengatasi Masalah
Hyperic membantu Cloudera nol dalam
pada sumber masalahnya dengan jelas membedakan
antara mesin akan turun dan daemon
turun , tabungan berharga
masalah waktu dan memungkinkan mereka
untuk bangkit kembali dan berjalan cepat .
" Kita juga dapat melihat
statistik mesin seperti beban dan penggunaan memori saat peringatan ,
yang membantu kita memecahkan masalah
mengapa mesin atau daemon mungkin telah turun , "
Loddengaard kata .
Peningkatan Keandalan data
Dengan signifikan meningkatkan uptime
, Hyperic mengurangi risiko kehilangan data, memungkinkan
Cloudera untuk memastikan keandalan
data.
Mengurangi Waktu Administrasi dan Usaha
Fitur autodetection Hyperic itu
mengurangi jumlah waktu administrasi dan usaha
Cloudera harus mengeluarkan untuk
mengkonfigurasi dan mengelola sistem pemantauan .
Hyperic otomatis
mengakui penyebaran baru dan
memungkinkan tim Cloudera untuk memperluas pemantauan terhadap
teknologi dengan menekan sebuah tombol
. Selain itu, kemudahan alat itu penggunaan mengurangi
beban administrasi .
" Sangat mudah bagi seseorang
untuk belajar Hyperic dan membuatnya bekerja , " menyimpulkan Loddengaard
. " The
kurva belajar jauh lebih sedikit dan
didukung oleh GUI yang bagus , dokumentasi membantu dan besar
mendukung staf . Hyperic juga sangat
mudah untuk mengelola dibandingkan dengan alat lain di luar sana . "
Tentang VMware
VMware , pemimpin global dalam
virtualisasi dan infrastruktur awan , memberikan customerproven
solusi yang mengurangi kompleksitas TI
sementara secara signifikan menurunkan biaya dan memungkinkan
lebih fleksibel , pelayanan tangkas.
Tentang VMware vFabric
VMware vFabric adalah aplikasi yang
ideal lingkungan platform untuk menjalankan dan mengelola kustom
CDH
Cloudera's 100% Open Source
Distribution of Hadoop
CDH
(Distribusi Cloudera yang Termasuk Apache Hadoop) yang paling lengkap, teruji,
dan banyak digunakan distribusi dunia Apache Hadoop. CDH adalah 100% open
source dan merupakan satu-satunya solusi Hadoop untuk menawarkan batch
processing, interaktif SQL dan mencari interaktif serta ketersediaan
berkelanjutan kelas perusahaan. Perusahaan lebih telah didownload CDH
dibandingkan semua distro lainnya digabungkan.
Ini
otomatisasi alat manajemen yang kuat menawarkan cara tercepat dan termudah
untuk mendapatkan klaster Hadoop Anda dan berjalan sehingga Anda dapat
menjelajahi penggunaan pertama kombinasi cases.This Anda berarti Anda dapat
yakin bahwa proyek Hadoop Anda akan dikerahkan lebih cepat dan dengan sukses
yang lebih besar jika Anda pergi dengan Cloudera.







