Agile Cat — in the cloud

December 22, 2009

Gartner : Ray Ozzie – Interview_2

2.0 The Importance of Microsoft Data Centers to Its Vision
30 October 2009
Neil MacDonald, David Mitchell Smith
http://www.gartner.com/technology/media-products/reprints/microsoft/172235.html

Gartner RAS Core Research Note G00172235

image

Gartner: Why do you think it is so important for Microsoft to get into owning the physical data centers and spending billions of dollars building its own cloud infrastructure versus just enabling others to do this with your software? It seems like there’s a big bet being placed that you have to own this infrastructure.

Gartner: Microsoft が物理的なデータセンターを所有して、クラウド・インフラストラクチャを構築して何十億ドルも投資することは、ソフトウェアを用いて実現していくことと比べて、どれほど重要だと思いますか? インフラストラクチャを自身で所有しなければならないということは、大きな賭けだと思われますが。

Ozzie: There are several reasons. The first is we’re not just a platform company. We’re an application company. So, we have huge infrastructure needs just for the applications we directly serve our consumers — Hotmail on the consumer side, Messenger, Xbox Live and the media service that supports Zune. Just on the consumer side, we have the need for enormous scale.

Ozzie: そこには、いくつかの理由があります。 最初の理由は、私たちがプラットフォームを提供する企業ではないということです。 私たちは、アプリケーションを提供する会社です。 そのため、私たちの顧客に対して、アプリケーションを来レクトに提供するための、膨大なインフラストラクチャが必要になります。 それらのアプリケーションには、コンシューマ向けの Hotmail や Xbox Live と、メディア・サービスとしての Zune などが含まれます。 コンシューマ向けのサービスだけでも、私たちは膨大なスケールを必要としています。

When I started at Microsoft, each one of these was a stovepiped application. They had their own servers. They had their own people that operated them, even in the common data centers. In essence, each was mirroring its own profit and loss all the way down the technology stack.

Microsoft での私の仕事が始まった時、それらのひとつひとつが、ストーブパイプのようなアプリケーションでした。そして、それらは独自のサーバーを持っていました。 共通のデータセンターの中でさえ、個別のオペレーション要員を持っていたのです。 本質に見て、それぞれのチームの利益と損失が、テクノロジー層の隅々にまで反映されていました。

I fundamentally believe that all the enterprise applications that we sell as software will also be a service. I know that every time you add a zero to the order of magnitude, you can do it more efficiently. So, if we are serving 100 million Exchange mailboxes, we’ll do it better than if we’re serving 1 million or 100,000. There is a significant advantage there.

私が確信しているのは、ソフトウェアとして販売する、すべてのエンタープライズ・アプリケーションがサービスにもなるということです。 私が常に認識しているのは、指標には何も加えなことであり、それにより効率が生じます。したがって、100 万や 10万の Exchange メールボックスをサポートしているなら、1 億をサポートしようとする時にも上手くいくでしょう。 そこに、重要なアドバンテージがあります。

If we’re doing it efficiently for ourselves, why not do it for others? One might ask, "Isn’t Microsoft a platform company? Doesn’t it have a lot of partners and a tremendous ecosystem?" Between 90% and 95% of our revenue comes through partners. It doesn’t come directly to us. And we want to keep a healthy worldwide ecosystem of partners alive. Just because we build our own data centers doesn’t mean we become the cloud.

私たち自身のために、それが出来るなら、他者のために出来ないはずはありません。 誰かが ”Microsoft はプラットフォームの会社ではないのですか? そして、パートナーとの間に強力なエコシステムを持っていませんか?" と尋ねるかもしれません。 実際に、私たちの収入における 90%~95% がパートナーを経由しています。 つまり、それだけの収益が、間接的にもたらされているのです。 そして、このワールドワイド・パートナーとの健全エコシステムを、維持したいと望みます。 私たちはのデータセンターを構築するだけであり、自身でクラウドになることを意味するわけではありません。

For this to be successful to enterprises, we must have this capability in every country — literally in every jurisdiction, all of which have different laws about information handling and privacy. It is a very complex environment. Although we can touch major markets, we cannot get everywhere. Therefore, we need ecosystem partners.

エンタープライズを成功させるためには、情報の管理とプライバシーについて異なる法を持つ、文字通り、すべての国とすべての地域で、こうした能力を発揮しなければなりません。 それは、とても複雑な環境です。 私たちが、主要なマーケットにアクセスできるとしても、すべての場所をカバーしているわけではありません。 そのために、私たちはエコシステムにおけるパートナーを必要とします。

Gartner: How can Microsoft differentiate itself in data centers?

Gartner: どのようにして、Microsoft は自身のデータセンターを差別化していくのですか?

Ozzie: In terms of data center evolution, I don’t think people really understand the importance of the advancement of data-center-level technology:

Ozzie: データセンターの進化という観点で、データセンター・レベルの先進的なテクノロジーの進化を、人々が本当の意味で理解するとは思いません:

In a first-generation data center, you’d get screwdrivers out and boot CDs. You’d install the machines in the racks, lay down the OS, configure the networks and so on. When I first came Microsoft just four years ago, that’s where we were — and I think that’s where most people were. Let’s just stay at the hardware level. I won’t even touch on the software level yet.

第 1世代のデータセンターでは、ネジ回しを取り出して、CD からブートしたでしょう。マシンをラックにインストールして、 OS を規定して、ネットワークを構成するなどしたでしょう。 私が 4年前に Microsoft に入社した時、それが実情であり、大半の場所でも同様だったと思います。 それは、ハードウェアのレベルに留まり、ソフトウェアのレベルに触れることはありませんでした。

A second-generation data center is what we referred to as a rack level of deployment. You might buy up to 100 machines or a couple of racks. You’d have them prebuilt by some third party. You’d bring it in and configure it all at once. It’s not like you’re assembling them — you aren’t building things yourself.

第 2世代のデータセンターでは、ラック・レベルのディプロイメントと呼ばれるものです。100 台くらいまでのマシンと、いくつかのラックが購入されたことでしょう。 サードパーティーが前もって作成した製品を、購入したはずです。 そして、一度にデータセンターに持ち込んで、コンフィグレーションしたでしょう。 それは、自身で構築したものでもなく、また、組み立てたものでもありませんでした。

The third generation is what we’re deploying now, which is bringing modularity to the level of containers. We build the shell of the building and deploy these containers into it. The first, second and third generation required that you determine how big the property you’re going to acquire is, as well as the availability of power. You build massive generators out to cover when the power fails. You build a huge shell of a building where all these racks will go, and then you start filling them until they are done. That filling takes a while, so you’ve got this big empty shell and big generators sitting there for a while, while you are filling them. The third-generation data center still has that shell, but it’s now containers — 2,000 or so computers in each— not a rack wall at a time.

第 3世代は、現時点でディプロイされているものであり、コンテナ・レベルのモジュール性に至るものです。簡単な建物を作り、その中にコンテナを配置します。 第 1/第 2/第 3世代のデータセンターで要求されたのは、必要とされる不動産と電力における許容力を、決定することでした。 そして、停電に備えて、外部に巨大な発電機を用意します。 すべてのラックを搬入する先として、巨大な建物を作り、そこがいっぱいになるまで満たしていきます。 しかし、そのためには少しの時間が必要です。 そのため、空の建物と巨大な発電機を設定した後で、その空間を埋めていくことになります。
第 3世代のデータセンターは建物を持ちますが、現時点では 2000 台ほどのコンピュータを取り込み、壁のように配置されたラックは存在しません。

The fourth generation, which is in trial now — and I’ll say we’ll move to that as a primary model within a year or so — is fully modular where you’re bringing in machines and power backup, and cooling on a modular basis as needed. This generation includes the whole supply chain from creation of the computers all the way up, and we’re trying to optimize that to weeks of lead time.

そして、私たちが現時点で試みているのが第 4世代であり、1~2年の間に、そのレベルに移行すると言えるようになるでしょう。そこには、必要とされるにマシンと、補助電源、冷却装置がモジュールとして取り込まれます。 この世代は、コンピュータの作成レベルからの、すべてのサプライチェーンを含み、数週間の準備期間で最適化できるようにトライしています。

This is all important because for a company like ours, which is building a lot of stuff, we don’t want to spend hundreds of millions of dollars that’s going to be sitting idle. Every enterprise will have some level of prebuild that they need to do. Every telecom partner and every government that builds data centers have the issue of how much they plan for and how much power they are wasting.

私たちのような、数多くのデータセンターを構築する企業は、アイドリング状態の設備に何億も使いたくないため、それらすべての特質が重要になってきます。 すべてのエンタープライズが、実施する必要のあるプリ・ビルドを、いくつかのレベルで持つことになるでしょう。 たとえば、データセンターを運用している、すべての通信パートナーと行政機関は、どれだけの電力を必要とし、また、浪費してしまうのかという問題を抱えています。

That’s just the hardware foundation. Then you overlay the software on top of that so that the systems we’re deploying are no longer deployed as stovepipes. There is a management fabric monitoring these, and dynamically moving workloads and powering off machines when they’re not in use and so on.

ただし、それは、単にハードウェアレベルの問題です。続いて、そこにソフトウェアの階層を載せて、実装するシステムがストーブパイプとしてディプロイされないようにします。 さらに、それらのファブリックに関するモニタリングや、データセンターの使用量に応じた、ワークロードのダイナミックな移行と、省電力などについても考えなければなりません。

If we didn’t need the scale that we’re doing, we wouldn’t be driving the innovation down this curve. I never realized until we started to engage with these major telecom partners how much they need R&D, because they’re mostly still at the first generation, or between the first and second generation.

私たちが具現化しようとしている、このスケールを必要としていなければ、イノベーション曲線をドライブすることはなかったでしょう。 私たちは、通信パートナーとの関わりを持ち始めるまで、彼らの R&D で、どれだけの費用が必要とされているのかを知りませんでした。つまり、彼らは第 1世代もしくは、第 1世代と第 2世代の間にいるのです。

Gartner: Do you think the typical enterprise data center will follow this same path of evolution?

Gartner: 一般的なエンタープライズ・データセンターも、そのような進化のパスをたどると思いますか?

Ozzie: Most enterprises don’t have the dynamic expansion and contraction that we need at our scale. Most still operate with stovepiped workload machine combinations. Most of them are still built with heterogeneous hardware configurations — not homogeneous. I think over time enterprises will absolutely benefit — even on-premises — from the fact that we will drive the hardware ecosystem into producing modular containers and providing more choice.

Ozzie: 大半のエンタープライズは、ダイナミックな拡大と収縮を持ちません。 それは、私たちのスケールにおいて必要とされるものです。 大半のケースで、ストーブパイプで接続されたマシンを用いて、ワークロードをこなしています。 また、大部分が異種ハードウェアでコンフィグレーションされ、同種にはなっていません。 私たちがモジュール式のコンテナを生産し、さらに多様な選択肢を提供するために、ハードウェアのエコシステムをドライブしていくという現実に基づき、いずれは、エンタープライズにおける絶対的な利益が生じるでしょう。 それは、オンプレミスであっても同じです。

Gartner: Do you see the evolution of the enterprise data center and the evolution of cloud computing infrastructure as being tightly coupled? Do you think that they converge?

Gartner: エンタープライズ・データセンターの展開と、クラウド・コンピューティング・インフラストラクチャの展開が、しっかりと連携する状況を確認していますか? それらは、一点に集約されると思いますか?

Ozzie: I believe that, generally, you take what you have and you incrementally get it to where it’s going. Historically, we’ve been building scale-up architectures in the data centers. We’ve been building systems with storage area networks, and we’ve been compensating for reliability by buying expensive hardware that’s reliable, as opposed to doing horizontal application models where you can kill a node and the system keeps operating. We then took the scale-up architectures and layered virtualization onto them to have more-flexible consolidation of workload management on this heterogeneous scale-up hardware. One customer’s cluster of machines that it runs virtualization on may be completely different from another’s. Even in a data center, you might have different classes of clustered machines. Some have a lot of memory, and some have reliable disks. It’s a patchwork.

Ozzie: 一般論でいうと、そうなると信じています。それらは段階的に具体化していくでしょう。 歴史的に見て、私たちのデータセンターでは、拡大のアーキテクチャを構築してきました。私たちは、システムの連続した運用や、ノードの削除などを可能にする、水平型のアプリケーション・モデルに対応するために、SAN(storage area network)を用いてシステムを構築し、また、高信頼性の高価なハードウェアを購入してきました。続いて、スケールアップのアーキテクチャを採用し、そこに何層かの仮想化レーヤーを載せました。 それにより、異種ハードウェアをスケールアップさせる、ワークロード管理における更に柔軟なコンソリデーションを実現しました。 仮想化されたマシン上の、ある顧客のクラスタは、他とは完全に分離されるかもしれません。 データセンターのレベルであっても、異なるクラスでクラスタ化されたマシンを持つかもしれません。 いくつかのマシンは、大量のメモリを持ち、また、いくつかは、信頼性の高いディスクを持ちます。 つまり、パッチワークのようなものになります。

The difference between where we’re going is that we’re very rigorous about saying, "No. It’s all horizontal." We’re going for homogeneity. And you don’t get the choice of having 10 machines with a ton of memory and 10 machines with bigger disks. We just say there are limited footprints. And maybe there are three: a big disk footprint, a big memory footprint and a big input/output footprint. However, there is limited choice, and you must program in an environment that lets you move in this direction. I think that this model will come into the data center, and you’ll end up with a split data center. You’ll have the current heterogeneous model and sitting side-by-side with it, literally, will be the homogeneous one. And you’ll begin to move workloads from one to the other as the vendors provide rewritten software to fit this new model.

私たちが到達しようとする領域の特異性は、「いいえ、それはまったく水平です」とは言いにくい点にあります。 私たちは、同種性を目指しています。 そして、膨大なメモリを持つ 10台のマシンと、大容量ディスクを持つ 10台のマシンを用意するという選択肢は、一般的にはあり得ません。 私たちが言えることは、そこには限定されたフットプリントがあるということです。 おそらく、大容量のィスク/メモリ/IO という、3つのフットプリントです。 しかし、限定された選択肢があり、その方向へと移行する環境の中で、プログラミングしなくてはなりません。 このモデルが、データセンターに入って来るだろうと思います。 そして、データセンターを分散させることが最終目標です。 現在の異種モデルを持ち、それらを並べて配置することになるでしょう。 それが、同種モデルになっていくのです。 そして、この新しいモデルに適合させるために、ベンダーが修正されたソフトウェアを提供するにつれて、そこにワークロードを移動していきます。

ーーー

最後の方は独演会みたいな感じで、う~ん、難しいですなぁ、、、としか言いようがありませんが、Ozzie の言う、データセンターの世代の定義がわかりました。 ーーー A.C.

<関連>
Gartner : Ray Ozzie – Interview 0
Gartner : Ray Ozzie – Interview_1
Gartner : Ray Ozzie – Interview_2
Gartner : Ray Ozzie – Interview_3
Gartner : Ray Ozzie – Interview_4
Gartner : Ray Ozzie – Interview_5
Gartner : Ray Ozzie – Interview_6

December 21, 2009

こっそりリリースされてた AppFabric SDK 1.0

Filed under: Microsoft — Agile Cat @ 2:17 pm
Tags: , , , , , ,

ダウンロードが開始されましたよ~~~

http://www.microsoft.com/downloads/details.aspx?FamilyID=39856a03-1490-4283-908f-c8bf0bfad8a5&displaylang=en

Windows Azure

Microsoft はオンプレミスとクラウドにおいて、大まかなところで同じように機能するツールを提供しようとしています。 それにより、エンタープライズ・プログラマーをクラウド開発に取り込もうとしているわけです。 Visual Studio 2010 と .Net 4.0 の次期バージョンの背景には、PDC 2009 の目玉としてデビューした AppFabric があり、それらのツールをエンタープライズだけではなく、クラウドにおいても同様に機能させるための、いくつかの接続を提供していきます。

AppFabric SDK DL 
その Windows Azure platform AppFabric SDK V1.0 のダウンロードが、12月19日の土曜日から、こっそりと開始されたとのことです。

ーーーーー

この情報は、http://twitter.com/louisville0919 さんから頂いたもので、ポストのタイトルも、ほとんど、そのまま、頂戴しちゃいました(笑) ーーー A.C.

<関連>
AppFabric とは?
Gartner : Ray Ozzie – Interview 0

11月のサーチ・エンジン・ランキング

Filed under: Research — Agile Cat @ 8:20 am
Tags: , , , , , , ,

comScore Releases November 2009 U.S. Search Engine Rankings
http://www.comscore.com/Press_Events/Press_Releases/2009/12/comScore_Releases_November_2009_U.S._Search_Engine_Rankings

com score

相変わらず、Google が強いですねぇ。 Yahoo がシェアを減らした分だけ、Bing にまわっていると言う感じで、この 2つの陣営間の比率は膠着状態です。

ComScore 09-12

こうして Bing が頑張ってくれる間に、シェアをキャッシュに変換していける Yahoo は、してやったりの契約だったんでしょうね。

<関連>
Youtube がダントツの動画配信量
2009/9 : 世界中で 270 億時間がインターネットに!
Bing と Yahoo の関係

Cloud Exchange: AWS Spot Prices を可視化

Cloud Exchange: AWS Spot Prices, Visualized
Data Center Knowledge より
December 18th, 2009 : Rich Miller
http://www.datacenterknowledge.com/archives/2009/12/18/cloud-exchange-aws-spot-prices-visualized/

A screen shot of Cloud Exchange, which displays dynamic pricing for Amazon Web Services. Earlier this week Amazon Web Services announced Spot Instances, which allows customers to buy computing power on Amazon’s EC2 cloud computing platform based on fluctuations in price. This dynamic pricing allows customers to save money by running applications when prices fall below a designated level, or outbid other customers for available capacity. How can you take advantage of these pricing trends?

Cloud Exchange のスクリーン・ショットが示すのは、Amazon Web Services に関する、動的な価格の推移である。今週の前半に Amazon Web Services がアナウンスした Spot Instances により、Amazon の EC2 クラウド・コンピューティング・プラットフォーム上のコンピューティング・パワーを、価格の変動に基づいて購入できるようになった。 この、動的な価格体系では、入札したレベルより価格が下がったとき、また、他の顧客よりも高いレベルで入札したときに、アプリケーションを実行するための費用を節約できるようになる。 しかし、どのようにして、価格の動きを把握して、アドバンテージを得ればよいのだろうか?

Cloud Exchange
Cloud Exchange provides a visual interface for the spot pricing data Amazon is making available to developers. The app was developed by Tim Lossen (who has made the code available via GitHub) and graphs pricing data on different instance types in three availability zones. We found this site via Matt Sherman, who argues that pricing is Amazon’s core competency.

Cloud Exchange が提供する Amazon の Spot Pricing データのためのビジュアル・インターフェイスは、そのための機能をデベロッパーに提示する。このアプリケーションは、Tim Lossen により開発されたものであり(GitHub を介してコードの利用が可能)、それぞれのインスタンスタイプにおける価格設定データを、3つのゾーンでグラフ表示する。なお、この価格設定が Amazon のコア・コンピタンシーだと主張する、Matt Sherman のサイトを介して、このサービスは発見された。

Here are a couple of additional resources and data points regarding Amazon Web Services:

  • Ryan Kearney’s post on Comparing CDN Performance that looks at how Amazon CloudFront’s content delivery performance compares to similar offerings from Rackspace, Go Grid and Simple CDN.
  • Amazon’s CloudFront began offering streaming video, a development that CDN analyst Dan Rayburn predicts will disrupt the market for content delivery. “While I don’t see Amazon changing the CDN landscape over night, they are already starting to have an impact on the market and as they continue to add more functionality to CloudFront, their impact will only continue to grow,” Dan writes. 
  • Guy Rosen at Jack of All Clouds has an early analysis of adoption of the new West Coast availability zone on EC2 with existing zones for the East Coast and Europe.

ーーー

Cloud Exchenge へのリンクをクリックすると、生データが見れますよ ~~~  A.C.

<関連>
Amazon の Media Streaming – CloudFront
Amazon Spot Instances を何と呼ぶ?

December 20, 2009

Cassandra プロジェクトと Rackspace

The Cassandra Project
http://www.rackspacecloud.com/blog/2009/09/23/the-cassandra-project/
// September 23rd, 2009 //
Development
By Jonathan Ellis, System Architect

image

You may have heard about the Cassandra distributed database in recent articles or conferences. I’d like to explain what advantages Cassandra offers over traditional relational databases like MySQL or Oracle and why Rackspace has committed resources to the Cassandra project.

最近の記事やカンファレンスでCassandra 分散データベースについて聞いたかもしれない。MySQLOracle といった、これまでのリレーショナル・データベースに対して、どのようなアドバンテージを Cassandra が提供するか、そして、Rackspace がCassandra プロジェクトに対する投資をコミットするる理由を説明する。

The Cassandra project was started by Facebook in 2007 to scale their internal applications, particularly Inbox Search. Earlier this year, they released it to the Apache incubator where other people from the community could become involved and start contributing. This allowed  the project to move forward in a direction that is more general to the public than just to Facebook’s needs.

Cassandra プロジェクトは 2007年に Facebook において、特に Inbox Search などの、内部アプリケーションをスケールアウトするために初めて使用された。 今年の初めに Facebook は、コミュニティの人々が関与し貢献できる Apache インキュベータに、Cassandra をリリースした。それにより、Facebook のニーズだけではなく、より一般的でパブリックな方向に前進していくプロジェクトが実現された。

In March, I became the first outside committer to this Apache Incubator project. Eric Evans from Rackspace and Jun Rao from IBM Research soon followed, and we recently added Chris Goffinet from Digg. The community has grown from 5 people in the IRC channel in December to  over 60.

そして 3月に私は、この Apache インキュベータ・プロジェクトの、最初の外部コミッターとなった。 Rackspace の Eric Evans と、IBM Research のJun Rao が、その直ぐ後に続き、最近になって Digg の Chris Goffinet が加わった。このコミュニティは、12 月時点の IRC チャネルにおける 5人から、60 人を超えるまでに成長した。

Distributed vs. Relational Databases

Traditional relational databases are 30 years old, are well understood and have a huge ecosystem of tools around them.  For that reason, it’s a compelling option when building your application. Postgres, MySQL, and Oracle are all relational databases modeling a schema on entities and relations between those entities. That’s a good, powerful programming model with interesting theoretical properties. But companies with large amounts of data have already gone past what you can reasonably fit on a single machine, even on high-end hardware, and it’s provably impossible to keep the traditional relational model, in particular the ACID properties, while scaling across multiple machines. Even if you’re willing to give up availability, scaling reads (via caching and replication) is difficult with relational databases, and scaling writes by partitioning is either very expensive, very painful from an application programming and operations standpoint, or both.

伝統的なリレーショナル・データベースは、その誕生から 30年を経過し、適切に理解され、そして、その周辺のツールと共に巨大なエコシステムを保持している。それらの理由により、一般的なアプリケーションを構築するときの説得力のある選択肢となっている。 Postgres や、MySQL、Oracle などは、その全てが、エンティティ上のスキーマと、エンティティ間に関係をモデリングする、リレーショナル・データベースである。 それは、理論的なプロパティへの関与を用いた、パワフルなプログラミング・モデルである。しかし、すでに膨大なデータを持つ企業は、それがハイエンド・ハードウェアであっても、シングル・マシンにフィットするデータ量を超えてしまい、とりわけ、ACID プロパティにおいては、従来からのリレーショナル・データベース・モデルを保持することは不可能となっているはずだ。たとえ可用性を犠牲にするとしても、(キャッシングとリプリケーションにより)読み取りのスケールをリレーショナル・データベースで調整することは困難であり、また、パーティショニングにより書き込みのスケールを調整することは、極めて高価なものとなる。したがって、アプリケーションのプログラミングとオペレーションの視点から、あるいは双方の視点から見ても、大きな痛みをもたらすことになる。

Cassandra is taking the approach that, given that you’re going to have to give up some parts of the relational model to scale, let’s start over and rethink things. Let’s add things like transparent replication and failover, built-in partitioning and load balancing, multiple data center support, and the ability to add capacity without ever disturbing applications running against the database.

Cassandra が採用するアプローチは、リレーショナル・モデルをスケーするという、いくつかの部分を断念することを前提とし、リンクを最初からやり直すことである。 そのために追加するものとしては、トランスペアレントなリプリケーションとフェイルオーバーおよび、ビルトインのパーティショニングとロード・バランシング、マルチ・データセンター・サポート、そして、データベースに反してアプリケーションの実行を止めることなくキャパシティを増やす能力などがある。

Rackspace’s Involvement

The original Facebook team has been busy elsewhere, so the community has had to step up and take the initiative in moving Cassandra forward.  Cassandra is open source and I don’t want to downplay others’ contributions, including those from IBM Research, Digg, and Twitter as well as other companies and individuals, but I’m proud that Rackspace’s support has been instrumental in adding many important new features, fixing bugs, and getting out new releases.

オリジナルの Facebook チームは多忙であるため、コミュニティは Cassandra forward を前進させるために、イニシアティブを見出し、ステップアップして良く必要があります。Cassandra はオープンソースであり、IBM Research/Digg/Twitter などの企業や、個人からのコントリビューションを軽視するものではないが、これまでに、Rackspace が重要な機能を加えて、バグを修正し、新しいリリースの配布において、重要な役割を担ってきたことにを誇りに思う。

Here are 3 reasons why Rackspace has committed resources:

こうして、Rackspace がコントリビュートしてきた理由は、以下のとおりである:

1-    As stated in previous posts by Erik Carlin, we are committed to an Open Cloud. With Amazon’s Simple DB or Google App Engine’s datastore, you’re locked in. Cassandra presents an open alternative: you can write against Cassandra and deploy anywhere.  That’s important.

1-    Erik Carlin の以前のポストで述べられているように、私たちは Open Cloud をコミットする。 Amazon の Simple DB であっても、Google App Engine の Datastore であっても、ユーザーはロックインされる。Cassandra が提示するのはオープンな選択肢であり、Cassandra を前提とした記述の、他へのディプロイを実現する。それは、重要なことである。

2-    We have a suite of Cloud products that are productized beyond just the raw Cloud Servers. Cassandra is interesting to us because we can use it under the hood to improve Cloud Sites and Cloud Files. And people are already starting to ask, “When can I just go to Rackspace and deploy a preconfigured Cassandra cluster?” It’s still early, but that’s definitely something we’re looking at.

2-   私たちの Cloud プロダクト・スイートは、単なる素材としての Cloud Servers を超えて効率化されている。 私たちが Cassandra に引きつけられるのは、Cloud Sites と Cloud Files を改善するための体系の中で、それを利用できるからである。 そして人々は、”Rackspace へ移行して、事前にコンフィグレーションされている Cassandra クラスタをディプロしできますか?」という、質問をし始めている。 それはまだ、早期に過ぎるが、私たちが注目しているものがある。

3-    Rackspace itself has a ton of data that we generate from our switches and routers and the rest of our infrastructure. Right now we are getting by with traditional monitoring and logging technologies, searching those logs and so forth. Cassandra will help us a lot with that as our volumes continue to increase. Our Mail & Apps products are also very interested in using Cassandra to store mail messages and other data.

3-    Rackspace 自身が膨大なデータを保有しているが、それらは、私たちのスイッチとルーターから生成され、また、その他のインフラストラクチャから生成される。 そしていま、従来からのモニタリングや、ログ、サーチのテクノロジーで問題を処理し、前へと進んでいる。私たちの保有するデータ量が増加し続けるにつれて、 それらの活用を Cassandra が支援するだろう。私たちの Mail & Apps プロダクトにおいても、メールメッセージと他のデータをストアするために、Cassandra を活用しようと前向きに検討している。

Finally, I want to emphasize Cassandra is not a magic bullet. You can’t just take your SQL app and put it on Cassandra and expect it to work.  It’s a different programming model and instead of modeling as entities and relationships and just adding indexes to get performance, you need to think at a more basic level: “What information do I need to retrieve from each query?” and model your Cassandra schema accordingly.  It’s a different way of thinking and does require new code to be written. It’s very much for people that have a lot data that doesn’t fit on a single machine and are feeling the pain from traditional approaches to scaling that.

最後に、Cassandra が特効薬ではないところを強調しておきたい。何らかの SQL アプリケーションを取り出して、Cassandra に押し込んでも、それが機能すると期待しないで欲しい。それは、別種のプログラミング・モデルであり、エンティティとリレーションのモデリングに替えて、また、パフォーマンスを得るためにインデックスを加えるだけのモデリングに替えて、より以上に基本的なレベルで考える必要がある:”それぞれのクエリーから、どのような情報を引き出す必要があのか?” という点を考え、それに従ったCassandra スキーマをモデリングしていく。 それは、異なる考え方であり、また、新しいコードの記述を必要とする。それは、シングル・マシンにフィットしないデータをもち、そのスケーリングに痛みを感じている人々に、きわめて適合するものとなる。

We plan to write some other posts in the future detailing what a switch might look like for some sample applications.

こうした考え方の切り替えを、詳細に示すサンプル・アプリケーションについて、今後のポストで説明していくことを計画している。

<関連>
NoSQL Ecosystem とは? _1
NoSQL Ecosystem とは? _2
NoSQL Ecosystem とは? _3
nosql-ja
サーバー保有台数ランキング
Rackspace のクラウド料金体系
ISP とクラウド経済

« Previous PageNext Page »

Theme: Rubric. Blog at WordPress.com.

Follow

Get every new post delivered to your Inbox.

Join 3,239 other followers