• Scalable: Hadoop can reliably store and process petabytes.

  • Economical: It distributes the data and processing across clusters of commonly available computers. These clusters can number into the thousands of nodes.

  • Efficient: By distributing the data, Hadoop can process it in parallel on the nodes where the data is located. This makes it extremely rapid.

  • Reliable: Hadoop automatically maintains multiple copies of data and automatically redeploys computing tasks based on failures.

    petabyte라는 단위가 생소하다. 환산을 해보자. 1PB = 1024TB

    위에 내용을 대략 정리를 하면, hadoop은 대용량 데이터를 신뢰성있게 처리를 할 수가 있고. 일반적인 사양의 컴퓨터에서도 적용이 가능하며, 자동으로 failover처리를 해서 신뢰성을 보장을 할 수가 있다는 이야기다.

    reference :

    Hadoop
    http://hadoop.apache.org/core/

    HadoopMapReduce
    http://wiki.apache.org/hadoop/HadoopMapReduce


    User inserted image
  • Posted by ologist
    이전버튼 1 ... 75 76 77 78 79 80 81 82 83 ... 666 이전버튼

    블로그 이미지
    ologist

    공지사항

    Yesterday221
    Today25
    Total34,406

    달력

     « |  » 2012.02
          1 2 3 4
    5 6 7 8 9 10 11
    12 13 14 15 16 17 18
    19 20 21 22 23 24 25
    26 27 28 29      

    최근에 받은 트랙백

    글 보관함