- Redshift, bulutta hızlı ve güçlü, tam olarak yönetilen, petabayt ölçekli bir veri ambarı hizmetidir.
- Müşteriler, Redshift'i herhangi bir taahhüt veya ön maliyet olmadan, saat başına yalnızca 0,25 ABD doları karşılığında kullanabilir ve yılda terabayt başına 1.000 ABD doları karşılığında bir petabayt veya daha fazlasına kadar ölçeklenebilir.
OLAP
OLAP bir Çevrimiçi Analitik İşleme Sistemi tarafından kullanılan Kırmızıya kayma .
OLAP işlemi Örnek:
Dijital Radyo Ürünü için EMEA ve Pasifik Net kârını hesaplamak istediğimizi varsayalım. Bu, çok sayıda kaydın çekilmesini gerektirir. Net Kar hesaplamak için gerekli kayıtlar aşağıdadır:
- EMEA'da satılan Radyoların toplamı.
- Pasifik'te satılan Radyoların toplamı.
- Her bölgedeki radyonun birim maliyeti.
- Radyonun satış fiyatı
- Satış fiyatı - birim maliyet
Yukarıda verilen kayıtları getirmek için karmaşık sorgular gereklidir. Veri Ambarı veritabanları, hem veritabanı perspektifinden hem de altyapı katmanından farklı türde mimari kullanır.
Kırmızıya Kayma Yapılandırması
Kırmızıya kayma iki tür düğümden oluşur:
Tek düğüm: Tek bir düğüm 160 GB'a kadar depolar.
Çok düğümlü: Çoklu düğüm, birden fazla düğümden oluşan bir düğümdür. İki türdendir:
İstemci bağlantılarını yönetir ve sorguları alır. Lider düğüm, istemci uygulamalarından sorguları alır, sorguları ayrıştırır ve yürütme planlarını geliştirir. Bu planların hesaplama düğümü ile paralel yürütülmesini koordine eder ve tüm düğümlerin ara sonuçlarını birleştirir ve ardından nihai sonucu istemci uygulamasına döndürür.
Bir hesaplama düğümü, yürütme planlarını yürütür ve ardından ara sonuçlar, istemci uygulamasına geri gönderilmeden önce toplanma için lider düğüme gönderilir. En fazla 128 hesaplama düğümüne sahip olabilir.
Lider düğüm ve hesaplama düğümleri kavramını bir örnek üzerinden anlayalım.
Redshift deposu, düğümler olarak bilinen bilgi işlem kaynaklarının bir koleksiyonudur ve bu düğümler, küme olarak bilinen bir grupta düzenlenir. Her küme, bir veya daha fazla veritabanı içeren bir Redshift Engine'de çalışır.
Bir Redshift örneğini başlattığınızda, 160 GB boyutunda tek bir düğümle başlar. Büyümek istediğinizde paralel işlemenin avantajlarından yararlanmak için ek düğümler ekleyebilirsiniz. Birden fazla düğümü yöneten bir lider düğümünüz var. Lider düğüm, bilgi işlem düğümlerinin yanı sıra istemci bağlantısını da yönetir. Verileri hesaplama düğümlerinde saklar ve sorguyu gerçekleştirir.
Redshift neden 10 kat daha hızlıdır?
Kırmızıya kayma aşağıdaki nedenlerden dolayı 10 kat daha hızlıdır:
Amazon Redshift, verileri bir dizi satır halinde depolamak yerine verileri sütunlara göre düzenler. Satır tabanlı sistemler işlem işleme için idealdir; sütun tabanlı sistemler ise sorguların genellikle büyük veri kümeleri üzerinde gerçekleştirilen toplamaları içerdiği veri ambarı ve analitik için idealdir. Yalnızca sorgularda yer alan sütunlar işlendiğinden ve sütunlu veriler bir depolama ortamında sırayla depolandığından, sütun tabanlı sistemler daha az G/Ç gerektirir, dolayısıyla sorgu performansı artar.
Sütunlu veri depoları, benzer veriler diskte sıralı olarak depolandığı için satır tabanlı veri depolarından çok daha fazla sıkıştırılabilir. Amazon Redshift, birden fazla sıkıştırma tekniği kullanır ve geleneksel ilişki veri depolarına kıyasla genellikle önemli düzeyde sıkıştırma elde edebilir.
Amazon Redshift, dizinlere veya somutlaştırılmış görünümlere ihtiyaç duymadığından geleneksel ilişkisel veritabanı sistemlerinden daha az alan gerektirir. Boş bir tabloya veri yüklerken Amazon Redshift verilerinizi otomatik olarak örnekler ve en uygun sıkıştırma tekniğini seçer.
Amazon Redshift, verileri otomatik olarak dağıtır ve sorguyu çeşitli düğümlere yükler. Amazon Redshift, veri ambarınıza yeni düğümler eklemeyi kolaylaştırır ve bu, veri ambarınız büyüdükçe daha hızlı sorgu performansı elde etmemize olanak tanır.
Kırmızıya kayma özellikleri
Redshift'in özellikleri aşağıda verilmiştir:
döngüler için java
Redshift'in kurulumu ve çalıştırılması kolaydır. AWS Konsolunda yalnızca birkaç tıklamayla yeni bir veri ambarı dağıtabilirsiniz ve Redshift, altyapıyı sizin için otomatik olarak hazırlar. AWS'de yedekleme ve çoğaltma gibi tüm yönetim görevleri otomatiktir; yönetime değil verilerinize odaklanmanız gerekir.
Redshift, verilerinizi otomatik olarak S3'e yedekler. Ayrıca olağanüstü durum kurtarma için S3'teki anlık görüntüleri başka bir bölgede de çoğaltabilirsiniz.
Amazon Redshift, yalnızca kullandığınız kadar ödeme yapmanız gerektiğinden en uygun maliyetli veri ambarı hizmetidir.
Maliyetleri, herhangi bir taahhüt ve ön maliyet olmaksızın, saat başına 0,25 ABD dolarından başlar ve yıllık terabayt başına 250 ABD dolarına kadar ölçeklenebilir.
Amazon Redshift, ön maliyet olmadan Talep Üzerine fiyatlandırma sunan tek veri ambarı hizmetidir ve aynı zamanda 1-3 yıl vadeli olarak %75'e varan tasarruf sağlayan Rezerve bulut sunucusu fiyatlandırması da sunar.
Kırmızıya Kaymayı optimize etmek için iki düğümden birini seçebilirsiniz.
Yoğun bilgi işlem düğümü, hızlı CPU'lar, büyük miktarda RAM ve katı hal diskleri kullanarak yüksek performanslı veri ambarları oluşturabilir.
Maliyeti düşürmek istiyorsanız Yoğun depolama düğümünü kullanabilirsiniz. Daha büyük bir sabit disk sürücüsü kullanarak uygun maliyetli bir veri ambarı oluşturur.
Amazon Redshift, ihtiyaç değişikliklerine göre düğümlerin ölçeğini otomatik olarak artırır veya azaltır. AWS Konsolunda yalnızca birkaç tıklamayla veya tek bir API çağrısıyla veri ambarındaki düğüm sayısı kolaylıkla değiştirilebilir.
Amazon S3'teki eksabaytlarca veriye yönelik sorguları çalıştırmanıza olanak tanıyan bir Redshift özelliğidir. Amazon S3, sınırsız veriyi açık formatta depolamaya yönelik güvenli ve uygun maliyetli bir veridir.
Bu, Redshift'in bir özelliğidir; birden fazla sorgunun Amazon S3'te aynı verilere erişebileceği anlamına gelir. Bir sorgunun karmaşıklığına veya veri miktarına bakılmaksızın sorguları birden çok düğümde çalıştırmanıza olanak tanır.
Amazon Redshift, veri yüklemeden Amazon S3 data lake'i sorgulamak için kullanılan tek veri ambarıdır. Bu, sık erişilen verileri Redshift'te, yapılandırılmamış veya seyrek erişilen verileri ise Amazon S3'te depolayarak esneklik sağlar.
Birkaç parametre ayarıyla Redshift'i verilerinizin güvenliğini sağlamak için SSL kullanacak şekilde ayarlayabilirsiniz. Şifrelemeyi de etkinleştirebilirsiniz; diske yazılan tüm veriler şifrelenecektir.
Amazon Redshift, sorguları gerçekleştirmek için gereken G/Ç miktarını azaltmak için sütunlu veri depolama, sıkıştırma ve paralel işleme sağlar. Bu, sorgu performansını artırır.