AWS(Amazon Web Service)で定時バッチを起動する方法 の調査
私は日頃はフツーの業務アプリのPGです。
まだバッチの作成業務にあたったことはありません。
ですが、バッチって便利だと思うんですよね。
例えば、WEBを自動でクロールしてAタグを拾って、
href属性の中身=URLをどんどんため込んでいく。
これがプログラム1。
プログラム2は、プログラム1がため込んだURLを取得して、
内容を解析して役立つデータに加工する。
プログラム2をバッチで毎日1回なり2回なり、
起動できるようになればいいですよね。
AWSに設置するにはどうすればよいのでしょうか?
「aws バッチ」で検索してみた。
■ アマゾン公式サイト
・バッチ処理PDF
http://d36cz9buwru1tt.cloudfront.net/jp/architecturecenter/RefArch_BatchProcessing_5Ar.pdf
よーく読まないと意味が分かりません。
■一般の方のサイト
・[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編
レベルが高い。
今はパターンよりも、どのサービスを使って、
どうやって動かすかを知りたい。
30Pに「SQSを使う」とある。
36Pに「シンプルな並列処理はSQSのみで実装するのが楽」とある。
・Amazon Web Services ブログ: 【AWS発表】Amazon SQSに新機能が追加! ロングポーリング、リクエストバッチ処理/クライアントサイドでのバッファリング
やはりSQSが出てきた。
Simple Queue Service (=SQS)のことらしい。
バッチオペレーション、遅延キュー、 タイマー、 AWS Management Console のサポート, CloudWatchメトリクス が使えるらしい。
バッチオペレーションやタイマーは関係ありそう。
明日はSQSについて調べてみよう。