RSS
Wecome to my Blog, enjoy reading :)

Kamis, 20 November 2014

Cloud Computing "Cloudera" Software

kawan kali ini icha akan negebahas software cloudera untuk cloud computer
 
PENGERTIAN CLOUDERA


Cloudera Inc adalah sebuah perusahaan yang berbasis di Amerika Alto perusahaan software Palo yang menyediakan perangkat lunak Apache Hadoop berbasis , dukungan dan layanan , dan pelatihan untuk didorong data perusahaan .
Open source Apache Hadoop distribusi Cloudera itu , CDH ( Cloudera Distribusi Termasuk Apache Hadoop ), menargetkan penyebaran kelas enterprise teknologi itu. Cloudera mengatakan bahwa lebih dari 50 % dari output rekayasa disumbangkan hulu ke berbagai Apache - berlisensi proyek open source ( Apache Hive , Apache Avro , Apache HBase , dan sebagainya) yang menggabungkan untuk membentuk platform Hadoop . Cloudera juga merupakan sponsor dari Apache Software Foundation . pilihan Demonim untuk karyawan Cloudera adalah " Clouderan .


TENTANG CLOUDERA

Cloudera adalah pemimpin dalam Hadoop berbasis Apache perangkat lunak dan layanan dan menawarkan platform data baru yang kuat yang memungkinkan perusahaan dan organisasi untuk melihat semua data mereka - terstruktur serta terstruktur - dan mengajukan pertanyaan yang lebih besar untuk wawasan belum pernah terjadi sebelumnya pada kecepatan pikiran .
Cloudera adalah teknologi start-up yang menyediakan tingkat perusahaan
produk dan layanan kepada pengguna dari Apache Hadoop, terbuka populer
implementasi sumber MapReduce, alat yang dirancang untuk mendalam
analisis data yang sangat besar.

Di balik beberapa pikiran top di Big Data , termasuk Doug Cutting , yang menemukan Hadoop , Cloudera meningkatkan teknologi penyimpanan dan pengolahan awalnya dikembangkan oleh perusahaan web terbesar di dunia . Hari ini , Cloudera adalah pemimpin pasar di Hadoop dengan puluhan ribu node di bawah manajemen , serta kontributor atas kode ke ekosistem Hadoop . Pasar termasuk jasa keuangan , pemerintah , telekomunikasi , media, web , iklan , ritel , energi, bioinformatika , farmasi / kesehatan , penelitian universitas , minyak dan gas, game dan banyak lagi.
Mengapa Open Source Matters
Sejak dimulai pada tahun 2008 , Cloudera telah sangat berkomitmen untuk berbasis masyarakat , open source Hadoop distribusi karena manfaat praktis bagi pelanggan .
Selain menawarkan manfaat dari open source , Cloudera telah memimpin cara untuk bekerja dengan pelanggan untuk memastikan bahwa kinerja mereka , ketersediaan , keamanan , dan pemulihan kebutuhan terpenuhi dalam platform open source , dimulai dengan keterlibatan pertama dengan Hadoop .
Keterlibatan yang mendalam Cloudera dalam masyarakat Hadoop memastikan pelanggan mendapatkan keuntungan dari keselarasan dekat roadmap open source dengan kebutuhan mereka - dan mendapatkan ahli , dukungan proaktif dari orang-orang yang tahu platform terbaik.

CHALLENGE
" Pemantauan cluster Hadoop kami sangat penting untuk pengujian dan penyebaran Cloudera yang
Distribusi untuk Hadoop ( CDH ) , "jelas Alex Loddengaard , Software Engineer , Cloudera .
" Hal ini sangat penting bahwa kita tahu mana mesin menurun, sehingga kami dapat memastikan kelompok kami
terus menjalankan pekerjaan batch processing meskipun kegagalan . Kegagalan mesin atau daemon
turun dapat menyebabkan hilangnya data. Tanpa pemantauan , ada kemungkinan bahwa kita akan
kehilangan data secara permanen . Selain itu, downtime untuk cluster ini akan mengganggu kami
pengembangan kerja dengan memperlambat tim engineering kami . Kita tidak bisa melewatkan rilis
tenggat waktu karena masalah perangkat lunak perangkat keras atau . "
Hadoop menyimpan file besar yang berpisah dan disimpan pada beberapa mesin yang berbeda .
Sebuah file terdiri dari beberapa " blok " dan setiap blok direplikasi ke beberapa node .
Jika cukup node turun, data tidak bisa diakses sampai mereka node datang kembali
up . Jika hard drive gagal , maka data tersebut tidak mungkin dapat dipulihkan .
Hadoop digunakan untuk menyimpan , mengolah dan menganalisa dataset besar , dan menggunakan replikasi internal yang
dan teknik toleransi kesalahan untuk bertahan hidup kegagalan hardware dan software . Off-site backup
tidak praktis karena hanya ada terlalu banyak data - puluhan , ratusan atau ribuan terabyte .
Karena itu, penting bahwa mesin dan daemon dan berjalan terus ,
untuk menjamin ketersediaan data dan reliabilitas, dan mencegah kehilangan data .
Loddengaard menambahkan bahwa arsitektur Hadoop memiliki satu titik kegagalan, NameNode .
"Jika NameNode turun , itu masalah besar karena semuanya akan berhenti , semua data akan
bisa diakses dan semua pekerjaan akan gagal . Jadi itu benar-benar penting bahwa kita tahu kapan
NameNode turun , karena cluster akan digunakan. "
larutan
Cloudera memutuskan cara terbaik untuk mengatasi tantangan ini adalah untuk menyebarkan VMware
vFabric ™ Hyperic ® solusi pemantauan . Loddengaard mengatakan bahwa beberapa alat yang baik memberikan
visibilitas sementara yang lain fokus pada memperingatkan , namun unggul Hyperic di kedua daerah . memberitahukan Hyperic
Staf Cloudera segera setiap kali mesin atau daemon sedang down , atau ketika disk penuh
- Dan semua fungsi ini penting disampaikan out-of -the-box dengan Hyperic .

MANFAAT

Hyperic memberikan hasil bisnis berikut untuk Cloudera :
Tinggi Mesin Ketersediaan
" Hyperic memungkinkan kita untuk memastikan ketersediaan mesin , dan pastikan berbagai batch processing
pekerjaan terus berjalan dengan benar , "kata Loddengaard . " Dengan Hyperic , kita segera tahu
ketika mesin atau daemon turun . Di Hadoop , satu-satunya cara bagi kita untuk otomatis
tahu jika mesin turun adalah dengan menggunakan alat pemantauan seperti Hyperic . Jika tidak , uptime
akan secara signifikan lebih rendah , karena tidak ada cara lain yang baik untuk mendapatkan informasi tersebut. "
" Jika kita tidak memiliki alat pemantauan seperti Hyperic , teknisi kami akan kemungkinan besar akan
orang untuk memberitahu kami ketika mesin sedang down , " ia menambahkan , " dan itu berarti perubahan signifikan
untuk uptime kami . Kami akan pergi dari 4 -9 yang kita dapatkan dengan Hyperic untuk 2 -9 atau bahkan 1-9 ,
tergantung pada berapa lama waktu insinyur kami untuk memberitahu kami tentang masalah . "

Respon Cepat Waktu
Hyperic memberdayakan tim Cloudera untuk segera merespon masalah ketersediaan .
Jika terpaksa bergantung pada insinyur untuk mengidentifikasi mesin dan downtime daemon , tanpa
Hyperic , waktu respon Cloudera yang bisa berjam-jam .
cepat Mengatasi Masalah
Hyperic membantu Cloudera nol dalam pada sumber masalahnya dengan jelas membedakan
antara mesin akan turun dan daemon turun , tabungan berharga
masalah waktu dan memungkinkan mereka untuk bangkit kembali dan berjalan cepat .
" Kita juga dapat melihat statistik mesin seperti beban dan penggunaan memori saat peringatan ,
yang membantu kita memecahkan masalah mengapa mesin atau daemon mungkin telah turun , "
Loddengaard kata .

Peningkatan Keandalan data
Dengan signifikan meningkatkan uptime , Hyperic mengurangi risiko kehilangan data, memungkinkan
Cloudera untuk memastikan keandalan data.

Mengurangi Waktu Administrasi dan Usaha
Fitur autodetection Hyperic itu mengurangi jumlah waktu administrasi dan usaha
Cloudera harus mengeluarkan untuk mengkonfigurasi dan mengelola sistem pemantauan .

Hyperic otomatis
mengakui penyebaran baru dan memungkinkan tim Cloudera untuk memperluas pemantauan terhadap
teknologi dengan menekan sebuah tombol . Selain itu, kemudahan alat itu penggunaan mengurangi
beban administrasi .
" Sangat mudah bagi seseorang untuk belajar Hyperic dan membuatnya bekerja , " menyimpulkan Loddengaard . " The
kurva belajar jauh lebih sedikit dan didukung oleh GUI yang bagus , dokumentasi membantu dan besar
mendukung staf . Hyperic juga sangat mudah untuk mengelola dibandingkan dengan alat lain di luar sana . "


Tentang VMware
VMware , pemimpin global dalam virtualisasi dan infrastruktur awan , memberikan customerproven
solusi yang mengurangi kompleksitas TI sementara secara signifikan menurunkan biaya dan memungkinkan
lebih fleksibel , pelayanan tangkas.

Tentang VMware vFabric
VMware vFabric adalah aplikasi yang ideal lingkungan platform untuk menjalankan dan mengelola kustom

CDH
Cloudera's 100% Open Source Distribution of Hadoop

CDH (Distribusi Cloudera yang Termasuk Apache Hadoop) yang paling lengkap, teruji, dan banyak digunakan distribusi dunia Apache Hadoop. CDH adalah 100% open source dan merupakan satu-satunya solusi Hadoop untuk menawarkan batch processing, interaktif SQL dan mencari interaktif serta ketersediaan berkelanjutan kelas perusahaan. Perusahaan lebih telah didownload CDH dibandingkan semua distro lainnya digabungkan.

Ini otomatisasi alat manajemen yang kuat menawarkan cara tercepat dan termudah untuk mendapatkan klaster Hadoop Anda dan berjalan sehingga Anda dapat menjelajahi penggunaan pertama kombinasi cases.This Anda berarti Anda dapat yakin bahwa proyek Hadoop Anda akan dikerahkan lebih cepat dan dengan sukses yang lebih besar jika Anda pergi dengan Cloudera.




1 komentar:

abraham mengatakan...

masih bingung kak fungsi dan realisasi dari cloudera. simplifly kak. tolong penjelaskan lebih simple nya. makasih kak.

Posting Komentar

 
Copyright 2009 Siti Chairunnisa Powered by Blogger
Blogger Templates created by Deluxe Templates
Wordpress by Ezwpthemes