<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Server in den Wolken &#187; datenbank</title>
	<atom:link href="http://serverwolken.de/tag/datenbank/feed/" rel="self" type="application/rss+xml" />
	<link>http://serverwolken.de</link>
	<description>Cloud Computing Magazin</description>
	<lastBuildDate>Mon, 22 Aug 2011 15:08:28 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Vortrag: MySQL Datenbank Monitoring + Geschwindigkeitsoptimierung</title>
		<link>http://serverwolken.de/vortrag-mysql-datenbank-monitoring-geschwindigkeitsoptimierung-2132/</link>
		<comments>http://serverwolken.de/vortrag-mysql-datenbank-monitoring-geschwindigkeitsoptimierung-2132/#comments</comments>
		<pubDate>Wed, 21 Apr 2010 13:38:09 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Technologien]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[development]]></category>
		<category><![CDATA[monitoring]]></category>
		<category><![CDATA[mysql]]></category>
		<category><![CDATA[performance]]></category>
		<category><![CDATA[skalierung]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=2132</guid>
		<description><![CDATA[Frisch von der MySQL User Conference, ein Vortrag von Ronald Bradford über MySQL Monitoring und Performance Optimierung.
10x Performance Improvements
View more presentations from Ronald Bradford.
via PHP hates me

]]></description>
			<content:encoded><![CDATA[<p>Frisch von der MySQL User Conference, ein Vortrag von Ronald Bradford über MySQL Monitoring und Performance Optimierung.</p>
<div id="__ss_3776503" style="width: 425px;"><strong style="display: block; margin: 12px 0 4px;"><a title="10x Performance Improvements" href="http://www.slideshare.net/ronaldbradford/10x-performance-improvements">10x Performance Improvements</a></strong><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="355" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=10x-improvement-mysql-100419105218-phpapp02&amp;rel=0&amp;stripped_title=10x-performance-improvements" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="425" height="355" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=10x-improvement-mysql-100419105218-phpapp02&amp;rel=0&amp;stripped_title=10x-performance-improvements" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>
<div style="padding: 5px 0 12px;">View more <a href="http://www.slideshare.net/">presentations</a> from <a href="http://www.slideshare.net/ronaldbradford">Ronald Bradford</a>.</div>
<div style="padding: 5px 0 12px;">via <a href="http://www.phphatesme.com/blog/mysql/10x-performance-improvements/">PHP hates me</a></div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/vortrag-mysql-datenbank-monitoring-geschwindigkeitsoptimierung-2132/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google App Engine stellt auf neuen, besseren Datastore um</title>
		<link>http://serverwolken.de/google-app-engine-stellt-auf-neuen-besseren-datastore-um-1465/</link>
		<comments>http://serverwolken.de/google-app-engine-stellt-auf-neuen-besseren-datastore-um-1465/#comments</comments>
		<pubDate>Fri, 18 Sep 2009 14:16:09 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[Technologien]]></category>
		<category><![CDATA[app engine]]></category>
		<category><![CDATA[database]]></category>
		<category><![CDATA[datastore]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[nosql]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=1465</guid>
		<description><![CDATA[Auf dem Google App Engine Blog findet sich ein bemerkenswert ausführlicher Artikel zum Umstieg auf den verbesserten Datastore. Dabei dreht es sich vor allem um die verbesserte Replikation zwischen verschiedenen Rechenzentren. Teilweise ähnelt der Artikel dem Vortrag den Ryan Barett bereits auf der Google I/O Konferenz gehalten hat. Aber auch wenn man den Vortrag schon kennt ist der Blogartikel lesenswert.
Ganz ohne Ausfall wird die Umstellung des Datastore verständlicherweise nicht sein. Entwickler die App Engine nutzen finden die geplanten Umstellungszeiten am Ende des Artikels.
]]></description>
			<content:encoded><![CDATA[<p>Auf dem Google App Engine Blog findet sich ein bemerkenswert ausführlicher <a href="http://googleappengine.blogspot.com/2009/09/migration-to-better-datastore.html">Artikel</a> zum Umstieg auf den verbesserten Datastore. Dabei dreht es sich vor allem um die verbesserte Replikation zwischen verschiedenen Rechenzentren. Teilweise ähnelt der Artikel dem <a href="http://code.google.com/intl/de-DE/events/io/sessions/TransactionsAcrossDatacenters.html">Vortrag</a> den Ryan Barett bereits auf der Google I/O Konferenz gehalten hat. Aber auch wenn man den Vortrag schon kennt ist der Blogartikel lesenswert.</p>
<p>Ganz ohne Ausfall wird die Umstellung des Datastore verständlicherweise nicht sein. Entwickler die App Engine nutzen finden die geplanten Umstellungszeiten am Ende des Artikels.</p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/google-app-engine-stellt-auf-neuen-besseren-datastore-um-1465/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Open Source Key-Value Store Scalien Keyspace in 1.1 erschienen</title>
		<link>http://serverwolken.de/open-source-key-value-store-scalien-keyspace-in-1-1-erschienen-1429/</link>
		<comments>http://serverwolken.de/open-source-key-value-store-scalien-keyspace-in-1-1-erschienen-1429/#comments</comments>
		<pubDate>Fri, 11 Sep 2009 07:00:49 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[Startups]]></category>
		<category><![CDATA[Technologien]]></category>
		<category><![CDATA[cloud]]></category>
		<category><![CDATA[cloud computing]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[key-value-store]]></category>
		<category><![CDATA[keyspace]]></category>
		<category><![CDATA[open source]]></category>
		<category><![CDATA[scalien]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=1429</guid>
		<description><![CDATA[Keyspace ist ein vom Startup Scalien entwickelter konsistent replizierter und ausfallsicherer Key-Value Speicher. Die Software ist gerade in Version 1.1 erschienen. Zeit sich das ganze mal etwas genauer anzusehen.
Als Open Source Software kann der Quelltext jederzeit eingesehen und angepasst werden. Zum Zugriff sollen verschiedene Bibliotheken angeboten werden. Zur Zeit ist lediglich eine für C verfügbar. Laut Dokumentation sind allerdings weitere für Python, PHP und Java geplant. Interessierte können aber sicher mithelfen. Stichwort Open Source.
Neben der Möglichkeit über ein eigenes Protokoll auf die Datenbank zuzugreifen, gibt es auch die Möglichkeit alle ...]]></description>
			<content:encoded><![CDATA[<p><a href="http://serverwolken.de/wp-content/uploads/2009/09/keyspace-vorteile.jpg"><img class="alignright size-full wp-image-1432" title="keyspace-vorteile" src="http://serverwolken.de/wp-content/uploads/2009/09/keyspace-vorteile.jpg" alt="keyspace-vorteile" width="417" height="519" /></a><a href="http://scalien.com/"></a>Keyspace ist ein vom Startup Scalien entwickelter konsistent replizierter und ausfallsicherer Key-Value Speicher. Die Software ist gerade in Version 1.1 <a href="http://blog.scalien.com/2009/09/09/keyspace-1.1-release/">erschienen</a>. Zeit sich das ganze mal etwas genauer anzusehen.</p>
<p>Als <a href="http://scalien.com/license/">Open Source Software</a> kann der Quelltext jederzeit eingesehen und angepasst werden. Zum Zugriff sollen verschiedene Bibliotheken angeboten werden. Zur Zeit ist lediglich eine für C verfügbar. Laut <a href="http://svn.scalien.com/keyspace/trunk/API">Dokumentation</a> sind allerdings weitere für Python, PHP und Java geplant. Interessierte können aber sicher mithelfen. Stichwort Open Source.</p>
<p>Neben der Möglichkeit über ein eigenes Protokoll auf die Datenbank zuzugreifen, gibt es auch die Möglichkeit alle Funktionen über HTTP aufzurufen. Was allerdings auf Grund des Overheads nur für die Entwicklung empfohlen wird. Hier allerdings, kann es durchaus Vorteile haben mal eben per Webbrowser in die Datenbank &#8220;gucken&#8221; zu können.</p>
<p>Das Bild rechts zeigt die Vorteile auf einen Blick. Neben der konsistenten Replikation, der Hochverfügbarkeit und Fehlertoleranz möchte Keyspace insbesondere durch hohe Performance und den einfachen Upgradepfad überzeugen.</p>
<p>Wie sich Keyspace im Vergleich mit anderen Key-Value Datenbanken schlägt muss sich noch zeigen. Vom Ansatz her wirkt das ganze aber sehr interessant.</p>
<p>Gegründet wurde Scalien, das Startup hinter Keyspace von <a href="http://scalien.com/ecard/mtrencseni">Marton Trencseni</a> und <a href="http://scalien.com/ecard/agazso">Attila Gazso</a>. Marton bloggt unter <a href="http://bytepawn.com/">Bytepawn.com</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/open-source-key-value-store-scalien-keyspace-in-1-1-erschienen-1429/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Soundcloud: Musik in der Wolke</title>
		<link>http://serverwolken.de/soundcloud-musik-in-der-wolke-449/</link>
		<comments>http://serverwolken.de/soundcloud-musik-in-der-wolke-449/#comments</comments>
		<pubDate>Sun, 01 Feb 2009 17:09:02 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[Startups]]></category>
		<category><![CDATA[ausfall]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[festplatte]]></category>
		<category><![CDATA[migration]]></category>
		<category><![CDATA[server]]></category>
		<category><![CDATA[serverausfall]]></category>
		<category><![CDATA[skalierung]]></category>
		<category><![CDATA[soundcloud]]></category>
		<category><![CDATA[umzug]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=449</guid>
		<description><![CDATA[Soundcloud ist nun wahrlich keine Neuigkeit mehr. Soundcloud beschreibt die eigenen Funktionen mit den drei Worten empfangen, senden und verteilen. Dabei geht es wie der Name vermuten lässt natürlich um Musik.
Man kann übersichtlich neue Musik der Künstler mit denen man innerhalb des Dienstes verbunden ist hören, man kann eigene Musik an andere senden und Soundcloud bietet zusätzlich noch einen Player um die eigene Musik in andere Seiten einzubinden und dort anhörbar zu machen. Die Versandfunktion will das versenden von großen Dateien erleichtern. Selbst ausprobiert habe ich den Dienst nicht. Bin ...]]></description>
			<content:encoded><![CDATA[<p><a href="http://soundcloud.com/tour"><img class="alignleft size-full wp-image-454" title="take-the-tour-soundcloud_1233508098598" src="http://serverwolken.de/wp-content/uploads/2009/02/take-the-tour-soundcloud_1233508098598.png" alt="take-the-tour-soundcloud_1233508098598" width="87" height="54" /></a>Soundcloud ist nun wahrlich <a href="http://netzwertig.com/2008/01/17/zn-soundcloud-musik-plattform-fur-hippe-produzenten-und-ihre-fans/">keine Neuigkeit mehr</a>. Soundcloud beschreibt die eigenen Funktionen mit den drei Worten empfangen, senden und verteilen. Dabei geht es wie der Name vermuten lässt natürlich um Musik.</p>
<p>Man kann übersichtlich neue Musik der Künstler mit denen man innerhalb des Dienstes verbunden ist hören, man kann eigene Musik an andere senden und Soundcloud bietet zusätzlich noch einen Player um die eigene Musik in andere Seiten einzubinden und dort anhörbar zu machen. Die Versandfunktion will das versenden von großen Dateien erleichtern. Selbst ausprobiert habe ich den Dienst nicht. Bin aber auch wahrlich kein Musiker.</p>
<p>Warum ich jetzt über Soundcloud schreibe ist dieser <a href="http://blog.soundcloud.com/2009/01/29/faster/">Blogpost</a>. Bei Soundcloud kam es im Zuge eines zur Behebung von Geschwindigkeitsproblemen ohnehin geplanten Serverumzuges zu einem Fehler mit den Festplatten des Datenbankservers. Dadurch ging die Seite offline und weil man sich gerade im Umzug befand blieb sie dies auch bis der Umzug abgeschlossen war. Für geschlagene zwölf Stunden.</p>
<p>Solche Vorfälle passieren immer wieder. Ob jetzt menschliches Versagen oder einfach Pech die Ursache dafür waren ist eigentlich nebensächlich. <strong>Fakt  ist, sowas darf nicht passieren wenn man ein Unternehmen aufbauen will</strong>.</p>
<p>Das Problem, die Skalierung der eigenen Plattform mit den Anforderungen ist schon tausendmal gelöst worden. Doch trotzdem muss es jedes Startup für sich selbst neu lösen. Warum? <strong>Weil die Hostingunternehmen nicht in der Lage sind funktionierende Lösungen zu schaffen um dieses Problem zu lösen</strong>.</p>
<p>Man ruht sich lieber auf seinen Lorbeeren aus und übertrifft sich gegenseitig mit Absenz jeglicher Innovation.</p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/soundcloud-musik-in-der-wolke-449/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Shardingtipps für Startups</title>
		<link>http://serverwolken.de/shardingtipps-fur-startups-302/</link>
		<comments>http://serverwolken.de/shardingtipps-fur-startups-302/#comments</comments>
		<pubDate>Sat, 17 Jan 2009 00:43:42 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Neuigkeiten]]></category>
		<category><![CDATA[cluster]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[performance]]></category>
		<category><![CDATA[sharding]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=302</guid>
		<description><![CDATA[Die Last auf Datenbankservern kann je nach Anwendung, Datenstruktur und Art der Daten zu einem echten Problem für Startups werden. Weil es im Gegensatz zu Webservern bei Datenbankservern nicht damit erledigt ist einfach weitere Maschinen zu starten sollte man sich frühzeitig Gedanken machen wie man mit Hilfe von Sharding die Last auf verschiedene Datenbankserver(cluster) verteilen kann.
Das Problem, gerade für Startups, dabei ist, dass man vorher nicht sagen kann welche der Daten sich gut zum sharding eignen, wo es sich lohnt und wenn nach welchem Muster man die Daten aufteilt. Ausserdem ...]]></description>
			<content:encoded><![CDATA[<p>Die Last auf Datenbankservern kann je nach Anwendung, Datenstruktur und Art der Daten zu einem echten Problem für Startups werden. Weil es im Gegensatz zu Webservern bei Datenbankservern nicht damit erledigt ist einfach weitere Maschinen zu starten sollte man sich frühzeitig Gedanken machen wie man mit Hilfe von Sharding die Last auf verschiedene Datenbankserver(cluster) verteilen kann.</p>
<p>Das Problem, gerade für Startups, dabei ist, dass man vorher nicht sagen kann welche der Daten sich gut zum sharding eignen, wo es sich lohnt und wenn nach welchem Muster man die Daten aufteilt. Ausserdem macht es häufig keinen Sinn Probleme zu lösen, die man noch nicht hat. Die wenigsten Startups haben direkt vom Start weg Performanceprobleme.</p>
<p>Wer an einem eigenen Webprojekt arbeitet sollte sich deshalb unbedingt den Artikel <a href="http://startuplessonslearned.blogspot.com/2009/01/sharding-for-startups.html">Sharding for Startups</a> auf Lessons learned durchlesen. In ausführlichster Form wird dort erklärt wie man ohne nicht vorhandene Probleme zu lösen trotzdem darauf vorbereitet sein kann.</p>
<p>via <a href="http://highscalability.com/database-sharding-startups">Highscalability</a></p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/shardingtipps-fur-startups-302/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Blick über den Tellerrand: memcache als Datenbankshard Index</title>
		<link>http://serverwolken.de/blick-uber-den-tellerrand-memcache-als-datenbankshard-index-181/</link>
		<comments>http://serverwolken.de/blick-uber-den-tellerrand-memcache-als-datenbankshard-index-181/#comments</comments>
		<pubDate>Mon, 05 Jan 2009 14:44:38 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Neuigkeiten]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[in-memory]]></category>
		<category><![CDATA[memcached]]></category>
		<category><![CDATA[shard]]></category>
		<category><![CDATA[sharding]]></category>

		<guid isPermaLink="false">http://serverwolken.de/?p=181</guid>
		<description><![CDATA[Auf dem Blog maxindelicato.com, dem Max Indelicato seinen Namen gibt, findet sich erneut, ich habe bereits vorher auf einen Artikel zum Thema Datenbanksharding verlinkt, ein überaus interessanter und lesenswerter Artikel. Diesmal geht es um die Frage ob und wie man memcached als Shard Index verwenden könnte. Lesen.
]]></description>
			<content:encoded><![CDATA[<p>Auf dem Blog <a title="memcached shard index" href="http://blog.maxindelicato.com/2009/01/alternative-memcache-usage-a-highly-scalable-highly-available-inmemory-shard-index.html">maxindelicato.com</a>, dem Max Indelicato seinen Namen gibt, findet sich erneut, ich habe bereits vorher auf einen Artikel zum Thema <a title="Datenbankskalierung durch Sharding" href="http://serverwolken.de/datenbankskalierung-durch-sharding-161/">Datenbanksharding</a> verlinkt, ein überaus interessanter und lesenswerter Artikel. Diesmal geht es um die Frage ob und wie man memcached als Shard Index verwenden könnte. Lesen.</p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/blick-uber-den-tellerrand-memcache-als-datenbankshard-index-181/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Datenbankskalierung durch Sharding</title>
		<link>http://serverwolken.de/datenbankskalierung-durch-sharding-161/</link>
		<comments>http://serverwolken.de/datenbankskalierung-durch-sharding-161/#comments</comments>
		<pubDate>Fri, 19 Dec 2008 17:58:42 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Neuigkeiten]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[datensätze]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[hochverfügbarkeit]]></category>
		<category><![CDATA[mysql]]></category>
		<category><![CDATA[postgresql]]></category>
		<category><![CDATA[relationale datenbanken]]></category>
		<category><![CDATA[sharding]]></category>
		<category><![CDATA[skalierung]]></category>

		<guid isPermaLink="false">http://serverwolken.planethold.de/?p=161</guid>
		<description><![CDATA[Auf maxindelicato.com findet sich ein sehr ausführlicher Artikel zum Thema Datenbankskalierung durch Sharding. Von Sharding spricht man wenn Datensätze auf verschiedene Teile aufgeteilt werden damit diese dann auf verschiedene Datenbankinstanzen verteilt werden können.
Zu Beginn nimmt sich der Artikel dabei die Zeit einige Begriffe zu erklären. Besonders hervorzuheben ist dabei die wichtige Unterscheidung zwischen Geschwindigkeit (Performance) und Skalierbarkeit. Der Unterschied ist nämlich, dass es bei Geschwindigkeit darum geht wie schnell ein System eine einzelne Anfrage beantworten kann, wohingegen Skalierbarkeit sich auf die Qualität des Systems unter Last bezieht.
Der Artikel will dabei ...]]></description>
			<content:encoded><![CDATA[<p>Auf <a title="Maxindelicato" href="http://blog.maxindelicato.com/">maxindelicato.com</a> findet sich ein sehr ausführlicher <a title="Scalability Strategies Primer: Database Sharding" href="http://blog.maxindelicato.com/2008/12/scalability-strategies-primer-database-sharding.html">Artikel</a> zum Thema Datenbankskalierung durch Sharding. Von Sharding spricht man wenn Datensätze auf verschiedene Teile aufgeteilt werden damit diese dann auf verschiedene Datenbankinstanzen verteilt werden können.</p>
<p>Zu Beginn nimmt sich der Artikel dabei die Zeit einige Begriffe zu erklären. Besonders hervorzuheben ist dabei die wichtige Unterscheidung zwischen Geschwindigkeit (Performance) und Skalierbarkeit. Der Unterschied ist nämlich, dass es bei Geschwindigkeit darum geht wie schnell ein System eine einzelne Anfrage beantworten kann, wohingegen Skalierbarkeit sich auf die Qualität des Systems unter Last bezieht.</p>
<p>Der Artikel will dabei die Frage beantworten, <strong>wieso unterteilen wir unsere Daten</strong> und <strong>wie hilft uns diese Unterteilung die Skalierbarkeit sicherzustellen</strong>. Dazu wirft der Autor zuersteinmal einen Blick auf verschiedene Anwendungszenarien an Hand derer man dann die beste Shardingstrategie für die eigenen Daten ableiten können soll. Die verschiedenen Szenarien gehen allerdings alle von bereits bestehenden Datensets aus. Wenn man noch garnicht genau weiss, wie die eigenen Daten aussehen werden helfen einem die Beispiele erstmal auch nicht übermässig. Gerade was Datum- bzw. Zeitabhängige Unterteilung angeht, denn diese ist nur dann sinnvoll, wenn die Datensätze auch gleichmässig über die Zeit verteilt sind. Dies wird allerdings nur bei den wenigsten Anwendungsszenarien von vorneherein absehbar sein. Auf dieses Problem geht der Artikel allerdings ebenfalls ein und widmet sich in einem eigenen Abschnitt der später vielleicht notwendig gewordenen Neuverteilung.</p>
<p>Im Anschluss beschäftigt sich der Artikel zusätzlich noch mit der Frage, wie das beschriebene System noch zusätzlich Hochverfügbar gemacht werden kann.</p>
<p><a title="Scalability Strategies Primer: Database Sharding" href="http://blog.maxindelicato.com/2008/12/scalability-strategies-primer-database-sharding.html"><strong>Hier gehts lang!</strong></a></p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/datenbankskalierung-durch-sharding-161/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Amazon schafft Persistenz bei EC2 Instanzen</title>
		<link>http://serverwolken.de/amazon-schafft-persistenz-bei-ec2-instanzen-45/</link>
		<comments>http://serverwolken.de/amazon-schafft-persistenz-bei-ec2-instanzen-45/#comments</comments>
		<pubDate>Fri, 22 Aug 2008 18:15:42 +0000</pubDate>
		<dc:creator>Philipp Strube</dc:creator>
				<category><![CDATA[Meinungen]]></category>
		<category><![CDATA[amazon web services]]></category>
		<category><![CDATA[aws]]></category>
		<category><![CDATA[blockspeicher]]></category>
		<category><![CDATA[datenbank]]></category>
		<category><![CDATA[db]]></category>
		<category><![CDATA[ebs]]></category>
		<category><![CDATA[ec2]]></category>
		<category><![CDATA[nas]]></category>
		<category><![CDATA[persistenz]]></category>
		<category><![CDATA[s3]]></category>

		<guid isPermaLink="false">http://serverwolken.planethold.de/?p=45</guid>
		<description><![CDATA[Zur Erklärung
Das größte Problem bei EC2 Instanzen bisher bestand darin, dass es keine Datenpersistenz gab. Das bedeutet, alle während der Laufzeit einer Instanz geänderten Daten die auf die Festplatte dieser Instanz geschrieben wurden waren verloren wenn die Instanz beendet wurde.
Wie jedem sofort einleuchten wird, ist dies natürlich ein großes Problem, wenn sich eine Maschine auf Grund irgendeines Fehlers während der Laufzeit verabschiedet. Normale Server fährt man wieder hoch und dank der Innovation bei den Journaling-Dateisystemen der letzten zehn Jahre kommt es nur sehr selten zu Datenverlusten. EC2 Instanzen hingegen kann ...]]></description>
			<content:encoded><![CDATA[<h2><img class="size-full wp-image-50 alignright" title="aws-logo" src="http://serverwolken.planethold.de/wp-content/uploads/2008/08/aws-logo.gif" alt="" width="170" height="69" />Zur Erklärung</h2>
<p>Das größte Problem bei EC2 Instanzen bisher bestand darin, dass es keine Datenpersistenz gab. Das bedeutet, alle während der Laufzeit einer Instanz geänderten Daten die auf die Festplatte dieser Instanz geschrieben wurden waren verloren wenn die Instanz beendet wurde.</p>
<p>Wie jedem sofort einleuchten wird, ist dies natürlich ein großes Problem, wenn sich eine Maschine auf Grund irgendeines Fehlers während der Laufzeit verabschiedet. Normale Server fährt man wieder hoch und dank der Innovation bei den <a title="Wikipedia" href="http://de.wikipedia.org/wiki/Journaling-Dateisystem">Journaling-Dateisystemen</a> der letzten zehn Jahre kommt es nur sehr selten zu Datenverlusten. EC2 Instanzen hingegen kann man nicht wieder hoch fahren. Das Prinzip der Wolke ist ja gerade, dass man nur virtuelle Maschinen hat. Es kann einem also egal sein auf welcher physischen Hardware man tatsächlich landet. Weil nach mir höchstwahrscheinlich jemand anderes auf der Maschine landet, ist es sogar in meinem Interesse, dass die Daten nicht auf der Platte bleiben.</p>
<p>Nun stellte die fehlende Persistenz Unternehmen vor 2 Probleme. Das eine Problem ist noch relativ leicht zu verkraften. Während der Laufzeit installierte Software, Sicherheitsupdates oder Konfigurationsänderungen wurden eben auch nicht übernommen. Jedesmal wenn das Image neu gestartet wurde hatte es wieder genau den Stand in dem man es bei S3 abgelegt hatte. Was im übrigen auch Vorteile hat. Man startet dadurch jede neue Instanz in einem genau vorhersehbaren Zustand. Lösungen für dieses Problem gab es zwei, entweder man lud nach seinen Änderungen jedesmal ein neues Image auf den S3 Speicherdienst hoch oder man speicherte die Änderung in kleinen inkrementellen Archiven ab. Diese wurden dann nach dem Start des Image nacheinander eingespielt und enthielten die nötigen Änderungen.</p>
<p>Wirklich problematisch ist, bzw. jetzt war, die fehlende Persistenz bei Datenbankservern. Wenn man nämlich seine komplette Infrastruktur innerhalb von Amazons EC2 betreiben wollte, hatte man immer das Problem, dass man seine Datenbankserver redundant und am besten nochmal irgendwo ausserhalb von EC2 vorhalten musste. Sonst wären nämlich alle Daten in der Datenbank seit dem letzten Backup beim beenden der Instanz verloren gewesen. Sobald eine Webapplikation die Datenbank aber ein bisschen intensiver nutzt als das 0815 Katzencontentblog sind häufige Backups ein echtes Problem.</p>
<h2>EBS zur Rettung</h2>
<p>EBS steht für Elastic Block Store und ist quasi eine Festplattenwolke. EBS ist ein Blockspeicher, der von jeder EC2 Instanz aus gemountet werden kann. Daten die auf EBS gespeichert sind, sind somit auch von jeder EC2 Instanz aus zu erreichen.</p>
<p>Details wie das ganze technisch umgesetzt ist und wie das ganze genutzt werden kann werde ich in Kürze nachliefern. Dazu möchte ich mir zwecks Recherche ein weniger mehr Zeit nehmen. Jetzt nur so viel, bereits der erste Blick auf die Möglichkeiten von EBS hat mir ein Lächeln ins Gesicht getrieben.</p>
<p>Abgerechnet wird EBS jedenfalls wie alle Amazon Web Services nach tatsächlicher Nutzung.</p>
<h2>Ausblick</h2>
<p>Mir persönlich fällt damit nur noch ein wirklicher Kritikpunkt bezüglich der Amazon Web Services ein. Es gibt keine SLAs (Service Level Agreements). D.h. Amazon garantiert nicht, dass man innerhalb einer bestimmten Zeit neue Maschinen bekommt. Sei es weil die eine ausgefallen oder man wegen eines Lastanstiegs mehr braucht.</p>
<p>Wer also sehr knapp kalkuliert und das werden junge Startups und Hobbyadmins, die EC2 als Ersatz für einen einzelnen Dedicated Server nutzen möchten, tun, hat ein Problem. Sobald man eine größere Anzahl EC2 Maschinen gleichzeitig nutzt spielt das ganze eine untergeordnete Rolle. Ob jetzt von meinen 3000 Instanzen 3 ausgefallen sind und ich die nächsten Stunden mit 2997 auskommen muss sollte den meisten Admins keine wirklichen Kopfschmerzen bereiten.</p>
<h2>Fazit</h2>
<p>Alles in allem ist EBS genau der Service der den Amazon Web Services noch gefehlt hat. Genau wie Markus auf <a title="Cloud Computing: Amazon startet Elastic Block Service" href="http://netzwertig.com/2008/08/22/cloud-computing-amazon-startet-den-elastic-block-service/">Netzwertig.com</a> bin auch ich hellauf begeistert von dieser Neuigkeit. Markus kreidet noch an, dass ein einfaches Benutzerinterface bisher fehlt. Aber wie er auch direkt prognostiziert werden wir da in Zukunft sicher noch einiges sehen. Wenn es nach mir geht in sehr naher Zukunft! Aber mehr kann ich dazu, zum jetzigen Zeitpunkt noch nicht verraten.</p>
]]></content:encoded>
			<wfw:commentRss>http://serverwolken.de/amazon-schafft-persistenz-bei-ec2-instanzen-45/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

