automated network management etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
automated network management etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

7 Temmuz 2015 Salı

Riverbed SteelCentral AppResponse 6000 [Opnet] ile network&uygulama analiz ve troubleshoot

Merhaba,


Bu yazımda uzun zamandır takip ettiğim ve yakınlarda inceleme fırsatı bulduğum Riverbed SteelCentral AppResponse 6000 bahsetmek istiyorum.

Network ve uygulama performansını izleyip, analiz ve troubleshoot etmek için kullanılan gerçekten başarılı bir ürün. Kapsamlı son kullanıcı deneyimi sunan ürün, uygulama ve network performansını analiz eden mühendislerin hayatını kolaylaştırıyor. Piyasada bu işi yaptığını iddia eden pekçok ürün bulunmakta. Riverbed bu konuda iddia etmekten bir adım öteye geçiyor ve nokta atışı sorun tespiti yapabiliyor. Networkünüzdeki tıkanıklıkları, darboğazları, performans problemlerinin kaynaklarını başarılı bir şekilde bulabiliyor. İşin güzel tarafı bu sorunların network yada uygulama kaynaklı olması farketmiyor. Bu anlamda uygulamacılar ile network uzmanları arasında uzun zaman süren çatışmalara da son veriyor. Ürün networkünüzdeki herhangi bir problemin hangi uygulama ve servisleri etkilediğini bulabiliyor. Böylece network mühendislerinin, problem son kullanıcıya ulaşmadan proaktif bir yaklaşımda bulunabilmesine izin veriyor.

Networkler son 15 yılda büyük değişime uğramış durumda. Networkü sadece router ve switchlerden oluşan bir altyapı olarak değerlendirmek artık pek de doğru bir yaklaşım olarak görülmüyor. Sanallaştırma, mobil cihazlara geçiş, uygulamaların web tabanlı dönüşümünün yaygınlaşması gibi konular networklerin yönetilmesini büyük ölçüde zorlaştırıyor. Forrester in yaptığı araştırmalara göre performans kaynaklı problemlerin %30 gibi azımsanmayacak bir kısmının çözülmesi minimum bir ay gibi zaman alıyor. Bir kısmıda hiçbir zaman tespit edilip çözülemiyor.
Network yönetimlerinin karşılaştığı bu problemlerin nedeni sahip olunan ürünlerin bazı yaklaşımları doğru olarak sergileyememesi olarak görülüyor. Bir NPM (Network Performance Manager) yada son kullanıcı deneyimi sunan ürün kullanıyor iseniz; Sahip olunan ürün monitoring ve torubleshooting arasında bağlantı kurabiliyor mu ? Uygulama performansı perspektifine sahip mi ? Son kullanıcı perspektifine sahip mi ? Manuel korelasyonlara ihtiyaç duyuyor mu ? gibi soruları kendinize sormanız gerekiyor. Riverbed'in ürünü bu sorulara çok net cevaplar verebileceğiniz bir yaklaşım sunuyor.

2012 yılında Riverbed in satın aldığı Opnet NPM & APM çözümlerinin kombinasyonu ile gerçekten vageçilmez bir ürün haline gelmiş durumda.



Borsa İstanbul firması network bölümünde Baş Uzman olarak çalışmakta olan Elektronik ve Haberleşme Mühendisi Sn. Kamber Aydın ürün ile ilgili sorularımızı cevapladı.

AppResponse 6000 ürününün yetenekleri nelerdir ?

Ürün network datasını toplayıp yorumlamaktadır. Ana amacı son kullanıcı deneyimi ile tespitlerde bulunarak derinlemesine analiz imkanı sunmaktır. Ürün şaşırtıcı biçimde datayı tek noktadan toplayarak nokta atışı tespitler yapmaktadır. Aynı paketleri discard eden deduplication mekanizmasına sahiptir. Topladığı paketlerden network ve sistem gecikmesini çıkarır. Riverbed ile yaptığımız işi ANPM (Application Specific Network Performance Management) olarak isimlendirebiliriz. 

Neden Riverbed AppResponse 6000 ürününü tercih ettiniz ?

Sorun anında troubleshoot amaçlı kullandığımız ürünler vardı. Biz bunun bir adım ötesine geçerek networkü devamlı izleyen ve aynı zamanda geriye dönük analizler de yapabileceğimiz bir araç arayışındaydık. Amacımız kritik noktaların sürekli olarak derinlemesine izlenmesi idi. Ürünün bu isteklerimizi detaylı olarak karşıladığını gördük. Oldukça kullanıcı dostu ekranlara sahip ürünün özelleştirilebilir arayüzü de bizi oldukça etkiledi. Ürünün Box ürün olması bizim için ayrıca bir tercih nedeni. Sunucular üzerine kurulan uygulamalar yüksek trafikte verimli çalışmayabiliyordu. Paket kaybı yada performans problemleri yaşanıyordu. İki adet 10G interface e sahip ürün donanım olarak oldukça iyi iş çıkarıyor.

AppResponse 6000 ürünü networkteki latency, jitter gibi olayları yakalayabiliyor mu ?

0,000000001 saniye hassasiyetle tespit yapabiliyor.


Ürün hayatınızda neleri kolaylaştırdı ?

Hızlı problem çözümü imkanı yanısıra sadece sorun anında değil devamlı ve geriye dönük olarak da kritik noktaları takip etme imkanı sağladı.

Ürünü networkünüzde nasıl konulandırdınız ?

Networkümüde oluşturduğumuz bir aggregator layer üzerinde izlenecek noktalardan gelen dataları toplamakta ve ürüne göndermekteyiz. Bunun için bir aggregator switch kullanmaktayız. Dataları yönlendirmek için ise Tap kullanımı ve mirroring yapmaktayız. Ürünün uygulama arayüzü ise bir dashboard server üzerinden yayın yapmaktadır.

Ürün diğer ürünler ile entegre olabiliyor mu ?

Ürün DataFeed, Trap, dashboard inser yöntemleri ile diğer ürünler ile entegre olabilmektedir. 

Üründe geliştirme yapılabiliyor mu ?

Evet Python ile yapılabiliyor.

Riverbed in tanıdığı ve derinlemesine izleyebildiği protokollere örnek verebilir misiniz ?

HTTP, Fix, Ftp, SSH, DB gibi birçok protokol izlenebilmekte. Yeni bir protokolü de ürüne tanıtmak mümkün. Ayrıca key sağlandığı taktirde https de izlemek mümkün.

Riverbed izlediği bir hattan geçen veriye parse ederek belli bir paterne uygun veriyi yakalayabilir mi ?

Evet. Örnek vermek gerekirse; geçen data içinde "Login Failed" yakaladığında alarm üretebilir.

Ürünün event, incident ve alarm yönetimi var mı ?

Evet. Dashboard üzerinde izlenebilir, sms ve email gönderebilir. Treshold belirlenebilir. TCP data izlenerek connection reset, reject, retransmit ler yakalanıp belli bir treshold geçildiğinde alarm üretebilir. 3rd party araçlar ile entegre olup besleme yapabilir.

Riverbed ile çözdüğünüz sorunlara örnek verebilir misiniz ?

Bir üyemiz yavaşlık problemi yaşamakta fakat WAN hatları incelendiğinde bir sıkıntı olmadığı görülmekteydi. WAN'da kayıp bulunmamaktaydı. Üye sadece belli bir uygulamada sorun yaşıyordu. Riverbed sorunun network kaynaklı olmadığını ve sunucudaki bir prosesin yüksek cpu tüketimine neden olduğunu net bir şekilde gösterdi. Daha derine indiğimizde ürünün Nagle ve Delayed Ack konularında da latency yapan cihazları tespit edebildiğini gördük.

Ürünü seçerken hangi kriterler etkili oldu ?
  • Firma ve personel yetkinliği (Sertifikalar, Referanslar, Deneyimler, vb.)
  • Sistem fiziksel özellikleri ve kapasitesi
  • Çözüm bileşenlerinin tek vendordan olması
  • HTTP&HTTPS analiz yeteneği
  • Ağ paketleri üzerinden kritik verileri gösterebilme yeteneği
  • L4-L7 analiz kapasitesi
  • Band genişliği değişiminin etkisinin simülasyonu
  • Dashboard ve özelleştirme özellikleri
  • Çeşitli protokolleri analiz ve yeni protokoller için özelleştirebilme yeteneği
  • Microburst analiz yeteneği
  • Paketlerin data kısmında istenen alanları parse edebilme yeteneği

Riverbed AppResponse 6000 ürününü tavsiye eder misiniz ?

Kesinlikle...

Teşekkürler,
Cem Selmanoğulları

27 Mayıs 2015 Çarşamba

NetBrain ile IT-Network izleme, otomasyon ve değişiklik yönetimi

Merhaba,

Son günlerde dikkatimi çeken NetBrain ürünü network otomasyon, troubleshoot ve change management konularına yeni bir bakış açısı getiriyor.



Network mühendisleri, çoğu ürünün görsel arayüzlerini kullanıcı dostu güvenilir bulmamaktadır. Görünüşe bakılırsa NetBrain bu bakışı yıkacak bir yaklaşım sunuyor. Model güdümlü arayüz sunan NetBrain network mühendisleri için geliştirilmiş güçlü bir CAD  (Computer-Aided Design) ve modelleme aracı olarak da ön plana çıkıyor. Networkünüzü keşfini takiben oluşturduğu interaktif topoloji haritaları ile yönetim ve troubleshoot operasyonlarını kolaylaştırıyor.

Peki NetBrain networkümüzü nasıl öğreniyor ?

SNMP, SSH/Telnet protokolleri ile tüm networkünüzden topladığı bilgileri ‘neighbor-walking’ keşif algoritması ile harmanlamaktadır. Binlerce snmp verisi ve ssh komut çıktısını birleştirerek networkünüzün matematiksel ve mantıksal tanımını elde eder. Sonrasında rendering işlemleri ile dinamik haritalar oluşturulur.

Bunu yaparken hangi bilgiler kullanılıyor ?

NetBrain cihazlardan routing tabloları, CDP ve ARP tablolarını, MAC adreslerini, STP bilgilerini ve daha pekçok veriyi ssh komutları ve snmp ile alıp harmanlamaktadır. Oluşturulan haritalar dinamik olup network değişiklikleri haritalara dinamik olarak yansıtılır. Ayrıca uçtan uca L3 ve L2 haritalar oluşturmak da mümkündür. Haritalar Visio ya atılarak çıktı alınabilir. Dinamik haritaları yanlızca topolojik görseller olarak düşünmeyin. Harita üzerindeki her cihaz ile etkileşime geçerek cihazları yönetebilir, torubleshoot ve change management işlemlerini yürütebilirsiniz. Burda yapılan operasyona görsel torubleshoot demek yanlış olmaz. Harita üzerinde cihazların canlı performans metriklerine ve geçmiş networksel değişimlere ulaşmak mümkündür.

Yavaş çalışan bir uygulamanın troubleshoot edildiği bir senaryoda uygulamanın network üzerinde uçtan uca akışını görsel olarak çıkarmak mümkündür. NetBrain bu konudaki çözümünü “Map+App” olarak isimlendirmektedir. Çoğu zaman yavaşlık problemleri network bölümlerine mal edilmekte ve bunu ispatlamak uzun zaman almaktadır. Map+App ile yaklaşımında sorunlu network segmentinin dinamik bir haritası çıkarılarak network performansı ile ilgili drill down işlemi yapılarak sorun tespiti yapılabilmektedir.

Altta kaynak ve hedef adresleri belirtilen bir uygulama için real-time akışı görebilirsiniz.



Ürün uygulama trafiğinin asimetrik olduğu durumları da hesaplayabilmektedir. Yani bir A noktasından B noktasına takip edilen akış dönüşte farklı bir yol takip ediyor ise bu iki farklı yolu ayrı ayrı incelemek mümkündür.




Ürün CLI kullanmadan torubleshoot a izin veren modüller içermektedir. Örnek vermek gerekirse “Layer-4 Port Level Analysis App” uçtan uca istediğiniz network yolunu çizerek anlık olarak nerede tıkanıklık olduğunu gösterir. Web yayını yapan sunucunuza http ile ulaşabiliyor fakat ftp ile ulaşamıyorsunuz. Aradaki yolda 10 a yakın network cihazı var. Ürün ACL, QoS, NAT gibi kontrolleri yaparak uçtan uca inceleme ile takılan noktayı bulur. Altta ACL konfigürasyonu yüzünden takılan Telnet ile ilgili bir örneği görebilirsiniz. LA-Core1-Demo cihazında f1/0/1 yanlış tanımlanan bir ACL sebebi ile bu cihazda Telnet geçişi bloklanmıştır. Bu tespit hiçbir manuel CLI komutu girmeden yapılmıştır.



Trafikteki günlük yada haftalık değişimleri görebilmek ister miydiniz ? Ürün bu konuda da oldukça fonksiyonel özellikler sunmaktadır. Son zamanlarda yapılan konfigürasyon değişiklikleri yada route değişimi sebebi ile bir uygulama performansında düşüş yaşanabilir. Bunun network kaynaklı mı uygulama kaynaklı mı olduğunu tespit için ilgili network segmentindeki değişimleri görmek gerekecektir. Bu noktada geçen hafta ile bu hafta arası iki nokta arası iletişimin hangi path üzerinden gerçekleştiğini çizdirerek nelerin değiştiğini görsel olarak tespit etmek oldukça kolaydır.



Ürünün Network Health uygulaması standart network uygulamalarında bulunan cihaz durumu, availibity, interface link performansı, delay, error, utilization gibi değerleri hem topoloji üzerinde hem interface bazlı hem de grafik olarak verebilmektedir.




Network mühendislerinin ihtiyaç duyduğu fakat bazı monitoring ürünlerinde beğenmediğim netflow analiz özelliği net brainde de bulunmakta.



Üründe kendi izleme modüllerini geliştirmeniz oldukça kolay. Örneğin “show processes cpu ” komutu çıktısından cpu değerini alıp buna treshold belirlemek ve treshold geçilince alarm üretmek oldukça kolay ve sürükle bırak şeklinde yapılabilmekte. Bunu kullandığınız her CLI komutu için 3 adımda yapmak mümkün. Ürün ssh ile cihaza bağlanıp belirlediğiniz komutu sizin adınıza girmekte ve çıktıda sizin önceden belirlediğiniz özellikler üzerinde arama yapmakta. Bulduğu değeri isteğinize uygun olarak yorumlamakta. Herhangi bir cihaza cli ile bağlanmadan harita üzerinden bu komutları çalıştırmanız yeterli. Ürün CLI alışkanlığına yeni bir bakış getiriyor. Putty yada SecureCRT ile cihaza bağlanayım ve komut yazayım yerine sağ tıkla komut çalıştır diyorsunuz…




Interface lerin durumlarını kontrol eden bir modül yazmanız yine mümkün.



















Layer-3 bir haritayı daha detaylı troubleshoot etmek için Layer-2 görüntüye çevirmeniz mümkündür. Dilerseniz yeni bir harita olarak oluşturabilir, dilerseniz var olan bir haritayı dönüştürebilirsiniz. “Bridge Network” görselleştirmek için güzel bir araç.



“WAN Congestion” yaşandığı durumlarda hızlı tespit için NetBrain real time topoloji haritası sunuyor. “Diagnostic Monitoring” ile Congestion yaşanan hatları göz önüne seriyor.



Herhangi bir network segmentinde kararsız bir durum oluşturuğunda canlı izleme özelliği ile o an segmentin durumunu görebilirsiniz. Hatayı netleştirmek için topladığınız data arttıkça rootcause bulma olasılığı da artacaktır. Flap eden yada down portları görsel olarak görebileceksiniz.



Belli bir segmente şüpheli bir tarfik akışı gördüğünüzde NetBrain segment ve çevresini görselleştirerek atak kaynağını ve etkilediği tüm ara ve hedef cihazları ortaya çıkarıp haritalandırabiliyor.




Gelelim NetBrain in en güzel özelliklerinden birine. Yukarıda belirlediğiniz şekilde bir atak yakaladığınızda NetBrain sizin yerinize önlem alabiliyor. Gerekli cihazlara bağlanıp statik bir route yazabiliyor yada ACL tanımlayabiliyor. Yani cihaz konfigürasyonlarını değiştirmek sureti ile atak yapan cihazı engelleyerek sizi bilgilendiriyor. Galiba otomasyonun geleceği bu…



Ürünün “Map-Driven Change Management” özelliği sayesinde birçok cihaza aynı anda QoS dizaynı dağıtılabiliyor.

Data Center içinde komplike bir değişiklik yapacaksınız. Dizayn ve konfigürasyon aşamasında yine NetBrain devreye giriyor. Network değişikliği planlayıp yeni dizanınızı ve konfigürasyonlarınızı hazırlıyorsunuz. NetBrain tüm değişiklilkeri cihazlara bağlanıp sizin adınıza yapıyor.
Değişiklikleri manuel yada otomatik yapın… Test etme aşamasında yine NetBrain den yararlanmanız mümkün. Erişilebilirlik testleri, CLI komut testleri, uygulama akış testleri, Routing tablosu değişiklik testleri gibi pek çok testi NetBrain e yaptırabiliyorsunuz. Data Center migration sonrası komple bir testi NetBrain sizin için yapsın.

Change Management modülü sayesinde bir yada daha fazla cihazda yapılacak konfigürasyon değişikliklerinin network üzerindeki etkileri görsel olarak izlenebilir, ok verildikten sonra otomatik olarak konfigürasyonlar NetBrain tarafından cihazlara yüklenebilir.

Ürün hakkında anlatılacak daha çok şey var. www.netbraintech.com sitesini ziyaret etmenizi öneririm. Sitede ürünün demo versiyonunu deneme şansınız da olacak. Ürünü geliştiren NetBrain firması 2004 yılında kurulmuş ve ana merkezi Massachussetts de bulunan bir yazılım firmasıdır. Kendilerini Network CAD özelliğini network dünyasına tanıtan ilk firma olarak tanımlıyorlar. Hemen hemen tüm yazılım eforlarını network yazılımlarına aktarmaktadırlar. British Telecom, Fidelity Investments, Thomson Reuters, IBM,HP,BP,NASA,at&t,Vodacom,verizon,US.Army, Texas Instruments gibi firmalar ürünü kullanmaktadırlar.

Teşekkürler,
Cem Selmanoğulları

19 Aralık 2014 Cuma

HP Network Automation Ürününü Tanıyalım

Merhaba,

Uzunca süre üzerinde çalıştığım ve çeşitli projeler yaptığım HP Network Automation ürününden bahsetmek isterim. Birçoğunuz HP NA olarak da tanıyorsunuz bu ürünü. HP nin Network Management ürün ailesine ait bir ürün olan HP NA oldukça sağlam ve oturmuş bir ürün.

Birçok kişinin paralel çalışarak günler içinde yapabileceği çalışmaları saatler ve hatta dakikalar içinde yapabiliyor. 500 tane router a 1 saat içinde değişik konfigurasyonlar yapabildiğinizi hayal edin ?

Ürünün yeteneklerine göz atalım;

Konfigurasyon Değişikliği Yönetimi :

Konfigurasyonlardaki değişiklikler kaydedilir. Buna snapshot diyoruz Geriye dönük eski konfigurasyonlara erişimi sağlar. İhtiyaç anında hızlı bir şekilde eski konfigurasyona dönülür. Yeni ve eski konfigurasyonlardaki değişiklikler satır satır karşılaştırılarak gösterilir. Böylece eski konfigurasyonda nelerin değiştitildiği, silindiği, eklendiği ve bunların kimler tarafından nezaman yaptığı bilgisi tutulur.

Uyumluluk kuralları (Complience Check) :

Tüm network cihazları bu kurallara göre taranır. Uyumsuzluk durumunda alarm üretilir yada uyumsuzluğu giderecek bir aksiyon oluşturulur (Remedation Script). Örnek vermek gerekirse networkünüzde cihazlarınız üzerinde telnet ayarı kalmadığından ve sadece ssh ayarlandığından nasıl emin olabilirsiniz ? NA tüm cihazlara belli periyodlarda bağlanıp kontrol eder. Unutulan bir telnet konfigurasyonu olması durumunda uyarı verir ve konfigurasyonu düzeltir. Anlayacağınız herhangi bir cihazda telnet konfigurasyonu unutuldu ise NA bunu silecek yerine SSH konfigurasyonu yazacaktır.

Araştırmalara göre network adminleri zamanlarının %45 ine kadarını manuel operasyonlarda harcamaktadırlar. 

Networkte Manuel Hatalar :

Network çalışanlarının pekçok zaman start-up konfigurasyon ve running konfigurasyonu kaydetmeyi unuttukları gözlenmektedir. Akabinde olabilecek herhangi bir kesinti yada sistem restartında yeni konfigurasyon kaybedilecektir. Bunun önüne geçmek için bu konfigurasyonların eşit olup olmadığı hergün NA tarafından kontrol edilir. Gerekirse eşit olmayanlar eşitlenir.

> HP NNM (Network Node Manager) ile entegre edilebilir. Envanterler NNM üzerinden güncellenebilir. Ayrıca NA kendisi de Network cihazlarını keşfedebilir. Network haritalandırması yapabilir.

> ITIL, COSO, SOX, PCI,CoBIT standartlarına uyunluğu araştırıp raporlar. Uyumsuzlukları force etme imkanı sağlar.

> NA güçlü bir ACL otomasyonu sağlar. Hazır templateler yada yeni oluşturulabilecek otomasyon scriptleri ile detaylı bir ACL otomasyonu sunar.

> Cihazların IOSların saklar. Gerekli durumlarda yeni IOS yüklenmesi ve güncellenmesine olanak sağlar.
IOS versiyonları envanterini tutar ve güncelliği kontrol eder. Güncel olmayanlar durumunda raporlama yapar.

> İş akışı onay mekanizması çalıştırabilirsiniz.

> HP Server Automation ile NA entegre çalışabilir ve Serverların hangi network cihazlarındaki hangi değişikliklerden etkilendiği gibi bilgilerin üretilmesi sağlanabilir.

> Patchlerin topluca cihazlara geçilmesine  olanak sağlar.

> Güçlü bir envanter takibi ve raporlaması sunar.

> Schedule joblar yada job grupları çalıştırılabilir.

> Gelişmiş command scriptleri hazırlanıp cihazlara grup bazlı basılmasına izin verir.

> CLI komutlarınız izlenerek yaptığınız işlerin bir script halinde kaydına izin verilir. Böylece bir cihazda yaptığınız değişiklikleri başka cihazlara script olarak topluca basabilirsiniz.

> Cihazlara bağlantılar sınırlandırılabilir. Sadece SSH yada SSH-2 kullanılabilecek şekilde force edilebilir.

> Cihaz konfigurasyonları NA arayüzünden değiştirilebilir, inline commentler eklenebilir ve deploy edilebilir.


Düşünün...

Onlarca satırlık ACL tanımlamanız olan 300 ün üzerinde cihazınız var. Bu ACL lerden 23 tanesi belli kriterlere göre silinecek, 12 tanesi değiştirilecek, 6 tane yeni eklenecek. Bu düzenlemeyi elle yapmak her cihaza bağlanarak nekadar zamanınızı alır ? Network Automation ile birkaç saat içinde bu işin bittiğini düşünün. Hem de manuel yaparken oluşabilecek hatalardan uzak bir şekilde.

Bir güvenlik açığı olduğunu ve bir gecede 1500 cihaza patch geçmeniz yada konfigurasyon değişikliği yapmanız gerektiğini düşünün. Paralel çalışarak kaç kişi kaç günde halledebilir bu işi.
Ya Otomasyonla kaç saate biter bu iş ?

Teşekkürler,
Cem Selmanoğulları