µÚ3ÕÂ
HadoopµÄ°²×°ºÍÊ¹ÓÃ

HadoopÊÇÒ»¸ö¿ªÔ´µÄ¡¢¿ÉÔËÐÐÓÚ´ó¹æÄ£¼¯ÈºÉÏµÄ·Ö²¼Ê½¼ÆËãÆ½Ì¨,ËüÖ÷Òª°üº¬·Ö²¼Ê½
²¢ÐÐ±à³ÌÄ£ÐÍMapReduceºÍ·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFS µÈ¹¦ÄÜ,ÒÑÔÚÒµÄÚµÃµ½¹ã·ºµÄÓ¦ÓÃ¡£
½èÖúÓÚHadoop,³ÌÐòÔ±¿ÉÒÔÇáËÉµØ±àÐ´·Ö²¼Ê½²¢ÐÐ³ÌÐò,½«ÆäÔËÐÐÓÚ¼ÆËã»ú¼¯ÈºÉÏ,Íê³É
º£Á¿Êý¾ÝµÄ´æ´¢Óë´¦Àí·ÖÎö¡£

±¾ÕÂÊ×ÏÈ¼òÒª½éÉÜHadoopµÄ·¢Õ¹Çé¿ö;È»ºó,²ûÊö°²×°HadoopÖ®Ç°µÄÒ»Ð©±ØÒª×¼±¸
¹¤×÷;×îºó,½éÉÜ°²×°HadoopµÄ¾ßÌå·½·¨,°üÀ¨µ¥»úÄ£Ê½¡¢Î±·Ö²¼Ê½Ä£Ê½ÒÔ¼°·Ö²¼Ê½Ä£Ê½¡£

1¡¡Hp¼ò½é

3.adoo

HadoopÊÇApacheÈí¼þ»ù½ð»áÆìÏÂµÄÒ»¸ö¿ªÔ´·Ö²¼Ê½¼ÆËãÆ½Ì¨,ÎªÓÃ»§Ìá¹©ÁËÏµÍ³µ×
²ãÏ¸½ÚÍ¸Ã÷µÄ·Ö²¼Ê½»ù´¡¼Ü¹¹¡£HadoopÊÇ»ùÓÚJavaÓïÑÔ¿ª·¢µÄ,¾ßÓÐºÜºÃµÄ¿çÆ½Ì¨ÌØÐÔ, 
²¢ÇÒ¿ÉÒÔ²¿ÊðÔÚÁ®¼ÛµÄ¼ÆËã»ú¼¯ÈºÖÐ¡£HadoopµÄºËÐÄÊÇHDFS ºÍMapReduce¡£

Apacop°æ±¾·ÖÎª3´ú, op1.op2.op3.

heHado·Ö±ðÊÇHado0¡¢Hado0ºÍHado0¡£µÚÒ»
´úHadop°üº¬0.x¡¢21.22.ÆäÖÐ,20.0.±ä³ÉÁËÎÈ

o20.0.xºÍ0.xÈý´ó°æ±¾, 0.x×îºóÑÝ»¯³É1.x, 
¶¨°æ,¶ø0.xºÍ0.xÔòÔö¼ÓÁËHDFSHA µÈÖØÒªµÄÐÂÌØÐÔ¡£µÚ¶þ´úHado23.

21.22.op°üº¬0.x 
ºÍ2.xÁ½´ó°æ±¾,ËüÃÇÍêÈ«²»Í¬ÓÚHadoop1.0,ÊÇÒ»Ì×È«ÐÂµÄ¼Ü¹¹,¾ù°üº¬HDFS 
FeeainºÍYARN(YeohrRsucoitr) op2.
drtotAnteeoreNegtaoÁ½¸öÏµÍ³¡£Hado0ÊÇ»ùÓÚ
JDK1.¶øJDK1.ÓÚÊÇHado8ÖØ

7¿ª·¢µÄ,7ÔÚ2015 Äê4ÔÂÒÑÍ£Ö¹¸üÐÂ, opÉçÇø»ùÓÚJDK1.
ÐÂ·¢²¼Ò»¸öÐÂµÄHadop°æ±¾, op3.µ½ÁËHado0ÒÔºó,

oÒ²¾ÍÊÇHado0¡£Òò´Ë, op3.JDK °æ±¾
µÄ×îµÍÒÀÀµ´Ó1.8¡£Hadoop3.°üÀ¨HDFS 

7±ä³ÉÁË1.0ÖÐÒýÈëÁËÒ»Ð©ÖØÒªµÄ¹¦ÄÜºÍÓÅ»¯, 
¿É²Á³ý±àÂë¡¢¶àÃû³Æ½ÚµãÖ§³Ö¡¢ÈÎÎñ¼¶±ðµÄMapReduce±¾µØÓÅ»¯¡¢»ùÓÚcgroupµÄÄÚ´æºÍ´Å
ÅÌI/O¸ôÀëµÈ¡£±¾Êé²ÉÓÃHado3.

op3.5¡£

³ýÁËÃâ·Ñ¿ªÔ´µÄApacheHadoopÒÔÍâ,»¹ÓÐÒ»Ð©ÉÌÒµ¹«Ë¾ÍÆ³öHadoopµÄ·¢ÐÐ°æ¡£
2008 Äê,Cloudera³ÉÎªµÚÒ»¸öHadoopÉÌÒµ»¯¹«Ë¾,²¢ÔÚ2009 ÄêÍÆ³öµÚÒ»¸öHadoop·¢ÐÐ
°æ¡£´Ëºó,ºÜ¶à´ó¹«Ë¾Ò²¼ÓÈëÁË×öHadoop²úÆ·»¯µÄÐÐÁÐ,ÈçMapR¡¢Hortonworks¡¢ÐÇ»·µÈ¡£
2018 Äê10 ÔÂ,ClouderaºÍHortonworksÐû²¼ºÏ²¢¡£Ò»°ã¶øÑÔ,ÉÌÒµ»¯¹«Ë¾ÍÆ³öµÄHadoop
·¢ÐÐ°æÒ²ÊÇÒÔApacheHadoopÎª»ù´¡,µ«ÊÇÇ°Õß±ÈºóÕß¾ßÓÐ¸üºÃµÄÒ×ÓÃÐÔ¡¢¸ü¶àµÄ¹¦ÄÜÒÔ
¼°¸ü¸ßµÄÐÔÄÜ¡£


µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 29 
3.2¡¡°²×°HadoopÇ°µÄ×¼±¸¹¤×÷
±¾½Ú½éÉÜ°²×°HadoopÖ®Ç°µÄÒ»Ð©×¼±¸¹¤×÷,°üÀ¨´´½¨hadoopÓÃ»§¡¢¸üÐÂAPT¡¢°²×°
SSH ºÍ°²×°Java»·¾³µÈ¡£
3.2.1 ´´½¨hadoopÓÃ»§
±¾ÊéÈ«²¿²ÉÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³,²¢ÎªhadoopÓÃ»§Ôö¼ÓÁË¹ÜÀíÔ±È¨ÏÞ¡£ÔÚ
Ç°ÃæµÄ¡°µÚ2ÕÂLinuxÏµÍ³µÄ°²×°ºÍÊ¹ÓÃ¡±ÄÚÈÝÖÐ,ÒÑ¾­½éÉÜÁËhadoopÓÃ»§´´½¨ºÍÔö¼ÓÈ¨ÏÞ
µÄ·½·¨,Ò»¶¨°´ÕÕ¸Ã·½·¨´´½¨hadoopÓÃ»§,²¢ÇÒÊ¹ÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³,È»ºóÔÙ
¿ªÊ¼ÏÂÃæµÄÑ§Ï°ÄÚÈÝ¡£±¾ÊéËùÓÐÑ§Ï°ÄÚÈÝ,¶¼ÊÇ²ÉÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³¡£
3.2.2 ¸üÐÂAPT 
±¾ÊéµÚ2ÕÂ½éÉÜÁËAPTÈí¼þ×÷ÓÃºÍ¸üÐÂ·½·¨,ÎªÁËÈ·±£Hadoop°²×°¹ý³ÌË³Àû½øÐÐ, 
½¨Òé°´ÕÕµÚ2ÕÂ½éÉÜµÄ·½·¨,ÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³ºó´ò¿ªÒ»¸öÖÕ¶Ë,Ö´ÐÐÏÂÃæÃü
Áî¸üÐÂAPTÈí¼þ: 
$ sudo apt-get update 
3.2.3 °²×°SSH 
SSH ÊÇSecureShellµÄËõÐ´,ÊÇ½¨Á¢ÔÚÓ¦ÓÃ²ãºÍ´«Êä²ã»ù´¡ÉÏµÄ°²È«Ð­Òé¡£SSH ÊÇÄ¿
Ç°½Ï¿É¿¿¡¢×¨ÎªÔ¶³ÌµÇÂ¼»á»°ºÍÆäËûÍøÂç·þÎñÌá¹©°²È«ÐÔµÄÐ­Òé¡£ÀûÓÃSSH Ð­Òé¿ÉÒÔÓÐÐ§
·ÀÖ¹Ô¶³Ì¹ÜÀí¹ý³ÌÖÐµÄÐÅÏ¢Ð¹Â¶ÎÊÌâ¡£SSH ×î³õÊÇUNIXÏµÍ³ÉÏµÄÒ»¸ö³ÌÐò,ºóÀ´ÓÖÑ¸ËÙ
À©Õ¹µ½ÆäËû²Ù×÷Æ½Ì¨¡£SSH ÓÉ¿Í»§¶ËºÍ·þÎñ¶ËµÄÈí¼þ×é³É:·þÎñ¶ËÊÇÒ»¸öÊØ»¤½ø³Ì,ËüÔÚ
ºóÌ¨ÔËÐÐ²¢ÏìÓ¦À´×Ô¿Í»§¶ËµÄÁ¬½ÓÇëÇó;¿Í»§¶Ë°üº¬ssh³ÌÐòÒÔ¼°Ïñscp(Ô¶³Ì¸´ÖÆ)¡¢slogin 
(Ô¶³ÌµÇÂ¼)¡¢sftp(°²È«ÎÄ¼þ´«Êä)µÈÆäËûµÄÓ¦ÓÃ³ÌÐò¡£
ÎªÊ²Ã´ÔÚ°²×°Hadoop Ö®Ç°ÒªÅäÖÃSSH ÄØ? ÕâÊÇÒòÎª,Hadoop Ãû³Æ½Úµã
(NameNode)ÐèÒªÆô¶¯¼¯ÈºÖÐËùÓÐ»úÆ÷µÄHadoopÊØ»¤½ø³Ì,Õâ¸ö¹ý³ÌÐèÒªÍ¨¹ýSSH µÇÂ¼
À´ÊµÏÖ¡£Hadoop²¢Ã»ÓÐÌá¹©SSH ÊäÈëÃÜÂëµÇÂ¼µÄÐÎÊ½,Òò´Ë,ÎªÁËÄÜ¹»Ë³ÀûµÇÂ¼¼¯ÈºÖÐ
µÄÃ¿Ì¨»úÆ÷,ÐèÒª½«ËùÓÐ»úÆ÷ÅäÖÃÎª¡°Ãû³Æ½Úµã¿ÉÒÔÎÞÃÜÂëµÇÂ¼ËüÃÇ¡±¡£
UbuntuÄ¬ÈÏÒÑ°²×°ÁËSSH ¿Í»§¶Ë,Òò´Ë,ÕâÀï»¹ÐèÒª°²×°SSH ·þÎñ¶Ë,ÔÚLinuxµÄÖÕ
¶ËÖÐÖ´ÐÐÒÔÏÂÃüÁî: 
$ sudo apt-get install openssh-server 
°²×°ºó,¿ÉÒÔÊ¹ÓÃÈçÏÂÃüÁîµÇÂ¼±¾»ú: 
$ ssh localhost 
Ö´ÐÐ¸ÃÃüÁîºó»á³öÏÖÍ¼3-1ËùÊ¾µÄÌáÊ¾ÐÅÏ¢(SSH Ê×´ÎµÇÂ¼ÌáÊ¾),ÊäÈëyes,È»ºó°´Ìá

30 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
Ê¾ÊäÈëÃÜÂëhadoop,¾ÍµÇÂ¼µ½±¾»úÁË¡£
Í¼3-1 SSH µÇÂ¼ÌáÊ¾ÐÅÏ¢
ÕâÀïÔÚÀí½âÉÏ»áÓÐÒ»µã¡°ÈÆÍä¡±¡£Ò²¾ÍÊÇËµ,Ô­±¾µÇÂ¼½øÈëLinuxÏµÍ³ÒÔºó,¾ÍÊÇÔÚ±¾»ú
ÉÏ,ÕâÊ±,ÔÚÖÕ¶ËÖÐÊäÈëµÄÃ¿ÌõÃüÁî¶¼ÊÇÖ±½ÓÌá½»¸ø±¾»úÈ¥Ö´ÐÐ,È»ºó,ÓÖÔÚ±¾»úÉÏÊ¹ÓÃ
SSH ·½Ê½µÇÂ¼µ½±¾»ú,ÕâÊ±,ÔÚÖÕ¶ËÖÐÊäÈëµÄÃüÁî,ÊÇÍ¨¹ýSSH ·½Ê½Ìá½»¸ø±¾»ú´¦Àí¡£Èç
¹û»»³É°üº¬Á½Ì¨¶ÀÁ¢¼ÆËã»úµÄ³¡¾°,SSH µÇÂ¼»á¸üÈÝÒ×Àí½â¡£ÀýÈç,ÓÐÁ½Ì¨¼ÆËã»úA ºÍB 
¶¼°²×°ÁËLinuxÏµÍ³,¼ÆËã»úBÉÏ°²×°ÁËSSH ·þÎñ¶Ë,¼ÆËã»úA ÉÏ°²×°ÁËSSH ¿Í»§¶Ë,¼Æ
Ëã»úBµÄIPµØÖ·ÊÇ59.77.16.33,ÔÚ¼ÆËã»úA ÉÏÖ´ÐÐÃüÁîssh59.77.16.33,¾ÍÊµÏÖÁËÍ¨¹ý
SSH ·½Ê½µÇÂ¼¼ÆËã»úBÉÏÃæµÄLinuxÏµÍ³,ÔÚ¼ÆËã»úA µÄLinuxÖÕ¶ËÖÐÊäÈëµÄÃüÁî,¶¼»á
Ìá½»¸ø¼ÆËã»úBÉÏµÄLinuxÏµÍ³Ö´ÐÐ,Ò²¾ÍÊÇËµ,ÔÚ¼ÆËã»úA ÉÏ²Ù×÷¼ÆËã»úBÖÐµÄLinux 
ÏµÍ³¡£ÏÖÔÚÖ»ÓÐÒ»Ì¨¼ÆËã»ú,¾ÍÏàµ±ÓÚ¼ÆËã»úA ºÍB¶¼ÔÚÍ¬Ò»Ì¨»úÆ÷ÉÏ,ËùÒÔÀí½âÆðÀ´¾Í
»áÓÐµã¡°ÈÆÍä¡±¡£
µ«ÊÇ,ÕâÑùµÇÂ¼ÐèÒªÃ¿´ÎÊäÈëÃÜÂë,ËùÒÔ,ÐèÒªÅäÖÃ³ÉSSH ÎÞÃÜÂëµÇÂ¼»á±È½Ï·½±ã,¶ø
ÇÒ,ÔÚHadoop¼¯ÈºÖÐ,Ãû³Æ½ÚµãÒªµÇÂ¼Ä³Ì¨»úÆ÷(Êý¾Ý½Úµã)Ê±,Ò²²»¿ÉÄÜÈË¹¤ÊäÈëÃÜÂë,Ëù
ÒÔ,Ò²ÐèÒªÉèÖÃ³ÉSSH ÎÞÃÜÂëµÇÂ¼¡£
Ê×ÏÈÊäÈëÃüÁîexitÍË³ö¸Õ²ÅµÄSSH,¾Í»Øµ½ÁËÔ­ÏÈµÄÖÕ¶Ë´°¿Ú;È»ºó¿ÉÒÔÀûÓÃsshkeygen
Éú³ÉÃÜÔ¿,²¢½«ÃÜÔ¿¼ÓÈëÊÚÈ¨ÖÐ,ÃüÁîÈçÏÂ: 
$ cd ~/.ssh/ #ÈôÃ»ÓÐ¸ÃÄ¿Â¼,ÏÈÖ´ÐÐÒ»´Îssh localhost 
$ ssh-keygen -t rsa #»áÓÐÌáÊ¾,°´Enter ¼ü¼´¿É
$ cat ./id_rsa.pub >> ./authorized_keys #¼ÓÈëÊÚÈ¨
´ËÊ±,ÔÙÖ´ÐÐsshlocalhostÃüÁî,ÎÞÐëÊäÈëÃÜÂë¾Í¿ÉÒÔÖ±½ÓµÇÂ¼ÁË,ÈçÍ¼3-2ËùÊ¾¡£
Í¼3-2 SSH µÇÂ¼ºóµÄÌáÊ¾ÐÅÏ¢
3.2.4 °²×°Java»·¾³
ÓÉÓÚHadoop±¾ÉíÊÇÊ¹ÓÃJavaÓïÑÔ±àÐ´µÄ,Òò´ËHadoopµÄ¿ª·¢ºÍÔËÐÐ¶¼ÐèÒªJavaµÄ
Ö§³Ö,¶ÔÓÚHadoop3.3.5¶øÑÔ,ÒªÇóÊ¹ÓÃJDK1.8»òÕß¸üÐÂµÄ°æ±¾¡£
·ÃÎÊOracle¹ÙÍø(https://www.oracle.com/technetwork/java/javase/downloads)ÏÂ
ÔØJDK1.8°²×°°ü¡£»òÕßÒ²¿ÉÒÔ·ÃÎÊ±¾Êé¹ÙÍø,½øÈë¡°ÏÂÔØ×¨Çø¡±,ÔÚ¡°Èí¼þ¡±Ä¿Â¼ÏÂÕÒµ½ÎÄ¼þ
jdk-8u371-linux-x64.tar.gz²¢½«ÆäÏÂÔØµ½±¾µØ¡£ÕâÀï¼ÙÉèÏÂÔØµÃµ½µÄJDK°²×°ÎÄ¼þ±£´æÔÚ

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 31 
UbuntuÏµÍ³µÄ/home/hadoop/Downloads/Ä¿Â¼ÏÂ¡£
Ö´ÐÐÈçÏÂÃüÁî´´½¨/usr/lib/jvm Ä¿Â¼ÓÃÀ´´æ·ÅJDKÎÄ¼þ: 
$cd /usr/lib 
$sudo mkdir jvm #´´½¨/usr/lib/jvm Ä¿Â¼ÓÃÀ´´æ·ÅJDK ÎÄ¼þ
Ö´ÐÐÈçÏÂÃüÁî¶Ô°²×°ÎÄ¼þ½øÐÐ½âÑ¹Ëõ: 
$cd ~ #½øÈëhadoop ÓÃ»§µÄÖ÷Ä¿Â¼
$cd Downloads 
$sudo tar -zxvf ./jdk-8u371-linux-x64.tar.gz -C /usr/lib/jvm 
ÏÂÃæ¼ÌÐøÖ´ÐÐÈçÏÂÃüÁî,ÉèÖÃ»·¾³±äÁ¿: 
$vim ~/.bashrc 
ÉÏÃæÃüÁîÊ¹ÓÃvim ±à¼­Æ÷´ò¿ªÁËhadoopÕâ¸öÓÃ»§µÄ»·¾³±äÁ¿ÅäÖÃÎÄ¼þ,ÔÚÕâ¸öÎÄ¼þ
µÄ¿ªÍ·Î»ÖÃ,Ìí¼ÓÈçÏÂ¼¸ÐÐÄÚÈÝ: 
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_371 
export JRE_HOME=${JAVA_HOME}/jre 
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib 
export PATH=${JAVA_HOME}/bin:$PATH 
±£´æ.bashrcÎÄ¼þ²¢ÍË³övim ±à¼­Æ÷¡£È»ºó,¼ÌÐøÖ´ÐÐÈçÏÂÃüÁîÈÃ.bashrcÎÄ¼þµÄÅäÖÃ
Á¢¼´ÉúÐ§: 
$source ~/.bashrc 
ÕâÊ±,¿ÉÒÔÊ¹ÓÃÈçÏÂÃüÁî²é¿´ÊÇ·ñ°²×°³É¹¦: 
$java -version 
Èç¹ûÄÜ¹»ÔÚÆÁÄ»ÉÏ·µ»ØÈçÏÂÐÅÏ¢,ÔòËµÃ÷°²×°³É¹¦: 
java version "1.8.0_371" 
Java(TM) SE Runtime Environment (build 1.8.0_371-b11) 
Java HotSpot(TM) 64-Bit Server VM (build 25.371-b11, mixed mode) 
ÖÁ´Ë,¾Í³É¹¦°²×°ÁËJava»·¾³¡£ÏÂÃæ¾Í¿ÉÒÔ½øÈëHadoopµÄ°²×°¡£
3.3¡¡°²×°Hadoop 
Hadoop°üÀ¨3ÖÖ°²×°Ä£Ê½¡£
(1)µ¥»úÄ£Ê½:Ö»ÔÚÒ»Ì¨»úÆ÷ÉÏÔËÐÐ,´æ´¢ÊÇ²ÉÓÃ±¾µØÎÄ¼þÏµÍ³,Ã»ÓÐ²ÉÓÃHDFS¡£
(2)Î±·Ö²¼Ê½Ä£Ê½:´æ´¢²ÉÓÃHDFS,µ«ÊÇHDFSµÄÃû³Æ½ÚµãºÍÊý¾Ý½Úµã¶¼ÔÚÍ¬Ò»Ì¨

32 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
»úÆ÷ÉÏ¡£
(3)·Ö²¼Ê½Ä£Ê½:´æ´¢²ÉÓÃHDFS,¶øÇÒHDFSµÄÃû³Æ½ÚµãºÍÊý¾Ý½ÚµãÎ»ÓÚ²»Í¬»ú
Æ÷ÉÏ¡£±¾
½Ú½éÉÜHadoopµÄ¾ßÌå°²×°·½·¨,°üÀ¨ÏÂÔØ°²×°ÎÄ¼þ¡¢µ¥»úÄ£Ê½ÅäÖÃ¡¢Î±·Ö²¼Ê½Ä£Ê½
ÅäÖÃ¡¢·Ö²¼Ê½Ä£Ê½ÅäÖÃµÈ¡£
3.3.1 ÏÂÔØ°²×°ÎÄ¼þ
±¾Êé²ÉÓÃµÄHadoop°æ±¾ÊÇ3.3.5,¿ÉÒÔµ½Hadoop¹ÙÍøÏÂÔØ°²×°ÎÄ¼þ(https://archive. 
apache.org/dist/hadoop/core/hadoop-3.3.5/),»òÕßÒ²¿ÉÒÔµ½±¾Êé¹ÙÍøµÄ¡°ÏÂÔØ×¨Çø¡±ÖÐÏÂÔØ
°²×°ÎÄ¼þ,µ¥»÷½øÈëÏÂÔØ×¨Çøºó,ÔÚ¡°Èí¼þ¡±Õâ¸öÎÄ¼þ¼ÐÖÐ,ÕÒµ½ÎÄ¼þhadoop-3.3.5.tar.gz,ÏÂ
ÔØµ½±¾µØ¡£ÓÉÓÚ±¾ÊéÈ«²¿²ÉÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³,ËùÒÔ,hadoop-3.3.5.tar.gzÎÄ¼þ
»á±»±£´æµ½/home/hadoop/Downloads/Ä¿Â¼ÏÂ¡£
ÏÂÔØÍê°²×°ÎÄ¼þÒÔºó,ÐèÒª¶ÔÎÄ¼þ½øÐÐ½âÑ¹¡£°´ÕÕLinuxÏµÍ³Ê¹ÓÃµÄÄ¬ÈÏ¹æ·¶,ÓÃ»§°²
×°µÄÈí¼þÒ»°ã¶¼ÊÇ´æ·ÅÔÚ/usr/local/Ä¿Â¼ÏÂ¡£Ê¹ÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³,´ò¿ªÒ»¸ö
ÖÕ¶Ë,Ö´ÐÐÈçÏÂÃüÁî: 
$ sudo tar -zxvf ~/Downloads/hadoop-3.3.5.tar.gz -C /usr/local 
#½âÑ¹µ½/usr/local ÖÐ
$ cd /usr/local/ 
$ sudo mv ./hadoop-3.3.5/ ./hadoop #½«ÎÄ¼þ¼ÐÃû¸ÄÎªhadoop 
$ sudo chown -R hadoop:hadoop ./hadoop #ÐÞ¸ÄÎÄ¼þÈ¨ÏÞ
Hadoop½âÑ¹ºó¼´¿ÉÊ¹ÓÃ,¿ÉÒÔÊäÈëÈçÏÂÃüÁîÀ´¼ì²éHadoopÊÇ·ñ¿ÉÓÃ,³É¹¦Ôò»áÏÔÊ¾
Hadoop°æ±¾ÐÅÏ¢: 
$ cd /usr/local/hadoop 
$ ./bin/hadoop version 
3.3.2 µ¥»úÄ£Ê½ÅäÖÃ
HadoopÄ¬ÈÏÄ£Ê½Îª·Ç·Ö²¼Ê½Ä£Ê½(±¾µØÄ£Ê½),ÎÞÐë½øÐÐÆäËûÅäÖÃ¼´¿ÉÔËÐÐ¡£Hadoop 
¸½´øÁË·á¸»µÄÀý×Ó,ÔËÐÐÈçÏÂÃüÁî¿ÉÒÔ²é¿´ËùÓÐÀý×Ó: 
$ cd /usr/local/hadoop 
$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5 
.jar 
ÉÏÊöÃüÁîÖ´ÐÐºó,»áÏÔÊ¾ËùÓÐÀý×ÓµÄ¼ò½éÐÅÏ¢,°üÀ¨grep¡¢join¡¢wordcountµÈ¡£ÕâÀïÑ¡
ÔñÔËÐÐgrepÀý×Ó,¿ÉÒÔÏÈÔÚ/usr/local/hadoopÄ¿Â¼ÏÂ´´½¨Ò»¸öÎÄ¼þ¼Ðinput,²¢¸´ÖÆÒ»Ð©ÎÄ
¼þµ½¸ÃÎÄ¼þ¼ÐÏÂ;È»ºó,ÔËÐÐgrep³ÌÐò,½«inputÎÄ¼þ¼ÐÖÐµÄËùÓÐÎÄ¼þ×÷ÎªgrepµÄÊäÈë,ÈÃ
grep³ÌÐò´ÓËùÓÐÎÄ¼þÖÐÉ¸Ñ¡³ö·ûºÏÕýÔò±í´ïÊ½dfs[a-z.]+µÄµ¥´Ê,²¢Í³¼Æµ¥´Ê³öÏÖµÄ´Î
Êý;×îºó,°ÑÍ³¼Æ½á¹ûÊä³öµ½/usr/local/hadoop/outputÎÄ¼þ¼ÐÖÐ¡£Íê³ÉÉÏÊö²Ù×÷µÄ¾ßÌåÃü
ÁîÈçÏÂ:

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 33 
$ cd /usr/local/hadoop 
$ mkdir input 
$ cp ./etc/hadoop/*.xml ./input #½«ÅäÖÃÎÄ¼þ¸´ÖÆµ½input Ä¿Â¼ÏÂ
$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop- mapreduce- examples- *.jar 
grep ./input ./output 'dfs[a-z.]+' 
$ cat ./output/* #²é¿´ÔËÐÐ½á¹û
Ö´ÐÐ³É¹¦ºó,ÈçÍ¼3-3ËùÊ¾,×÷ÒµµÄÏà¹ØÐÅÏ¢»áÊä³öÔÚÆÁÄ»ÉÏ,Êä³öµÄ½á¹ûÊÇ·ûºÏÕýÔò
±í´ïÊ½µÄ,µ¥´Êdfsadmin³öÏÖÁË1´Î¡£
Í¼3-3 grep³ÌÐòÔËÐÐ½á¹û
ÐèÒª×¢ÒâµÄÊÇ,HadoopÄ¬ÈÏ²»»á¸²¸Ç½á¹ûÎÄ¼þ,Òò´Ë,ÔÙ´ÎÔËÐÐÉÏÃæÊµÀý»áÌáÊ¾³ö´í¡£
Èç¹ûÒªÔÙ´ÎÔËÐÐ,ÐèÒªÏÈÊ¹ÓÃÈçÏÂÃüÁî°ÑoutputÎÄ¼þ¼ÐÉ¾³ý: 
$ rm -r ./output 
3.3.3 Î±·Ö²¼Ê½Ä£Ê½ÅäÖÃ
Hadoop¿ÉÒÔÔÚµ¥¸ö½Úµã(Ò»Ì¨»úÆ÷)ÉÏÒÔÎ±·Ö²¼Ê½µÄ·½Ê½ÔËÐÐ,Í¬Ò»¸ö½Úµã¼È×÷ÎªÃû
³Æ½Úµã(NameNode),Ò²×÷ÎªÊý¾Ý½Úµã(DataNode),¶ÁÈ¡µÄÊÇ·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFS ÖÐµÄ
ÎÄ¼þ¡£
1. ÐÞ¸ÄÅäÖÃÎÄ¼þ
ÐèÒªÅäÖÃÏà¹ØÎÄ¼þ,²ÅÄÜ¹»ÈÃHadoopÔÚÎ±·Ö²¼Ê½Ä£Ê½ÏÂË³ÀûÔËÐÐ¡£HadoopµÄÅäÖÃÎÄ
¼þÎ»ÓÚ/usr/local/hadoop/etc/hadoop/ÖÐ,½øÐÐÎ±·Ö²¼Ê½Ä£Ê½ÅäÖÃÊ±,ÐèÒªÐÞ¸ÄÁ½¸öÅäÖÃÎÄ
¼þ,¼´core-site.xmlºÍhdfs-site.xml¡£
¿ÉÒÔÊ¹ÓÃvim ±à¼­Æ÷´ò¿ªcore-site.xmlÎÄ¼þ,ËüµÄ³õÊ¼ÄÚÈÝÈçÏÂ: 
<configuration> 
</configuration> 
ÐÞ¸ÄÒÔºó,core-site.xmlÎÄ¼þµÄÄÚÈÝÈçÏÂ: 
<configuration> 
<property> 
<name>hadoop.tmp.dir</name> 
<value>file:/usr/local/hadoop/tmp</value> 
<description>Abase for other temporary directories.</description> 
</property> 
<property> 
<name>fs.defaultFS</name> 
<value>hdfs://localhost:9000</value> 
</property> 
</configuration>

34 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
ÔÚÉÏÃæµÄÅäÖÃÎÄ¼þÖÐ,hadoop.tmp.dirÓÃÓÚ±£´æÁÙÊ±ÎÄ¼þ,ÈôÃ»ÓÐÅäÖÃhadoop.tmp.dir 
Õâ¸ö²ÎÊý,ÔòÄ¬ÈÏÊ¹ÓÃµÄÁÙÊ±Ä¿Â¼Îª/tmp/hadoo-hadoop,¶øÕâ¸öÄ¿Â¼ÔÚHadoopÖØÆôÊ±ÓÐ
¿ÉÄÜ±»ÏµÍ³ÇåÀíµô,µ¼ÖÂÒ»Ð©ÒâÏë²»µ½µÄÎÊÌâ,Òò´Ë,±ØÐëÅäÖÃÕâ¸ö²ÎÊý¡£fs.defaultFSÕâ¸ö
²ÎÊý,ÓÃÓÚÖ¸¶¨HDFSµÄ·ÃÎÊµØÖ·,ÆäÖÐ,9000ÊÇ¶Ë¿ÚºÅ¡£
Í¬Ñù,ÐèÒªÐÞ¸ÄÅäÖÃÎÄ¼þhdfs-site.xml,ÐÞ¸ÄºóµÄÄÚÈÝÈçÏÂ: 
<configuration> 
<property> 
<name>dfs.replication</name> 
<value>1</value> 
</property> 
<property> 
<name>dfs.namenode.name.dir</name> 
<value>file:/usr/local/hadoop/tmp/dfs/name</value> 
</property> 
<property> 
<name>dfs.datanode.data.dir</name> 
<value>file:/usr/local/hadoop/tmp/dfs/data</value> 
</property> 
</configuration> 
ÔÚhdfs-site.xmlÎÄ¼þÖÐ,dfs.replicationÕâ¸ö²ÎÊýÓÃÓÚÖ¸¶¨¸±±¾µÄÊýÁ¿,ÒòÎªÔÚHDFS 
ÖÐ,Êý¾Ý»á±»ÈßÓà´æ´¢¶à·Ý,ÒÔ±£Ö¤¿É¿¿ÐÔºÍ¿ÉÓÃÐÔ¡£µ«ÊÇ,ÓÉÓÚÕâÀï²ÉÓÃÎ±·Ö²¼Ê½Ä£Ê½,Ö»
ÓÐÒ»¸ö½Úµã,Ö»¿ÉÄÜÓÐ1¸ö¸±±¾,Òò´ËÉèÖÃdfs.replicationµÄÖµÎª1¡£dfs.namenode.name.dirÓÃ
ÓÚÉè¶¨Ãû³Æ½ÚµãµÄÔªÊý¾ÝµÄ±£´æÄ¿Â¼,dfs.datanode.data.dirÓÃÓÚÉè¶¨Êý¾Ý½ÚµãµÄÊý¾Ý±£´æ
Ä¿Â¼,ÕâÁ½¸ö²ÎÊý±ØÐëÉè¶¨,·ñÔòºóÃæ»á³ö´í¡£
ÅäÖÃÎÄ¼þcore-site.xmlºÍhdfs-site.xmlµÄÄÚÈÝ,Ò²¿ÉÒÔÖ±½Óµ½±¾Êé¹ÙÍøµÄ¡°ÏÂÔØ×¨Çø¡± 
ÏÂÔØ,Î»ÓÚ¡°´úÂë¡±Ä¿Â¼ÏÂµÄ¡°µÚ3ÕÂ¡±×ÓÄ¿Â¼ÏÂµÄ¡°Î±·Ö²¼Ê½Ä£Ê½ÅäÖÃ¡±×ÓÄ¿Â¼ÖÐ¡£
ÐèÒªÖ¸³öµÄÊÇ,HadoopµÄÔËÐÐ·½Ê½(ÈçÔËÐÐÔÚµ¥»úÄ£Ê½ÏÂ»¹ÊÇÔËÐÐÔÚÎ±·Ö²¼Ê½Ä£Ê½
ÏÂ),ÊÇÓÉÅäÖÃÎÄ¼þ¾ö¶¨µÄ,Æô¶¯HadoopÊ±»á¶ÁÈ¡ÅäÖÃÎÄ¼þ,È»ºó¸ù¾ÝÅäÖÃÎÄ¼þÀ´¾ö¶¨ÔËÐÐ
ÔÚÊ²Ã´Ä£Ê½ÏÂ¡£Òò´Ë,Èç¹ûÐèÒª´ÓÎ±·Ö²¼Ê½Ä£Ê½ÇÐ»»»Øµ¥»úÄ£Ê½,Ö»ÐèÒªÉ¾³ýcore-site.xml 
ÖÐµÄÅäÖÃÏî¼´¿É¡£
2. Ö´ÐÐÃû³Æ½Úµã¸ñÊ½»¯
ÐÞ¸ÄÅäÖÃÎÄ¼þÒÔºó,ÒªÖ´ÐÐÃû³Æ½ÚµãµÄ¸ñÊ½»¯,ÃüÁîÈçÏÂ: 
$ cd /usr/local/hadoop 
$ ./bin/hdfs namenode -format 
Èç¹û¸ñÊ½»¯³É¹¦,»á¿´µ½successfullyformattedµÄÌáÊ¾ÐÅÏ¢(¼ûÍ¼3-4)¡£
Èç¹ûÔÚÖ´ÐÐÕâÒ»²½Ê±ÌáÊ¾´íÎóÐÅÏ¢Error:JAVA_HOMEisnotsetandcouldnotbe 
found,ÔòËµÃ÷Ö®Ç°ÉèÖÃJAVA_HOME»·¾³±äÁ¿µÄÊ±ºò,Ã»ÓÐÉèÖÃ³É¹¦,°´Ç°ÃæµÄ½Ì³ÌÏÈÉè
ÖÃºÃJAVA_HOME±äÁ¿,·ñÔò,ºóÃæµÄ¹ý³Ì¶¼ÎÞ·¨Ë³Àû½øÐÐ¡£

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 35 
Í¼3-4 Ö´ÐÐÃû³Æ½Úµã¸ñÊ½»¯ºóµÄÌáÊ¾ÐÅÏ¢
3. Æô¶¯Hadoop 
Ö´ÐÐÏÂÃæÃüÁîÆô¶¯Hadoop: 
$ cd /usr/local/hadoop 
$ ./sbin/start-dfs.sh #start-dfs.sh ÊÇ¸öÍêÕûµÄ¿ÉÖ´ÐÐÎÄ¼þ,ÖÐ¼äÃ»ÓÐ¿Õ¸ñ
Èç¹û³öÏÖÍ¼3-5ËùÊ¾µÄSSH ÌáÊ¾,ÊäÈëyes¼´¿É: 
Í¼3-5 Æô¶¯HadoopºóµÄÌáÊ¾ÐÅÏ¢
Æô¶¯Ê±¿ÉÄÜ»á³öÏÖÈçÏÂ¾¯¸æÐÅÏ¢: 
WARN util. NativeCodeLoader: Unable to load native - hadoop library for your 
platform... using builtin-java classes where applicable WARN 
Õâ¸ö¾¯¸æÌáÊ¾ÐÅÏ¢¿ÉÒÔºöÂÔ,²¢²»»áÓ°ÏìHadoopÕý³£Ê¹ÓÃ¡£
Èç¹ûÆô¶¯HadoopÊ±Óöµ½Êä³ö·Ç³£¶àssh:CouldnotresolvehostnamexxxµÄÒì³£Çé
¿ö,ÈçÍ¼3-6ËùÊ¾¡£
Í¼3-6 HadoopÆô¶¯ºóµÄ´íÎóÌáÊ¾ÐÅÏ¢

36 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
Õâ¸ö²¢²»ÊÇSSH µÄÎÊÌâ,¿ÉÒÔÍ¨¹ýÉèÖÃHadoop»·¾³±äÁ¿À´½â¾ö¡£Ê×ÏÈ,°´×éºÏ¼ü
Ctrl+CÖÐ¶ÏÆô¶¯¹ý³Ì;È»ºó,Ê¹ÓÃvim ±à¼­Æ÷´ò¿ªÎÄ¼þ~/.bashrc,ÔÚÎÄ¼þ×îÉÏ±ßµÄ¿ªÊ¼Î»
ÖÃÔö¼ÓÈçÏÂÁ½ÐÐÄÚÈÝ(ÉèÖÃ¹ý³ÌÓëJAVA_HOME ±äÁ¿Ò»Ñù,ÆäÖÐ,HADOOP_HOME Îª
HadoopµÄ°²×°Ä¿Â¼): 
export HADOOP_HOME=/usr/local/hadoop 
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native 
±£´æ¸ÃÎÄ¼þÒÔºó,Îñ±ØÒªÖ´ÐÐÃüÁîsource~/.bashrcÊ¹±äÁ¿ÉèÖÃÉúÐ§;È»ºó,ÔÙ´ÎÖ´ÐÐ
ÃüÁî./sbin/start-dfs.shÆô¶¯Hadoop¡£
HadoopÆô¶¯Íê³Éºó,¿ÉÒÔÍ¨¹ýÃüÁîjpsÀ´ÅÐ¶ÏÊÇ·ñ³É¹¦Æô¶¯,ÃüÁîÈçÏÂ: 
$ jps 
Èô³É¹¦Æô¶¯,Ôò»áÁÐ³öÈçÏÂ½ø³Ì(¼ûÍ¼3-7):NameNode¡¢DataNodeºÍSecondaryNameNode¡£
Í¼3-7 HadoopÆô¶¯³É¹¦ÒÔºóµÄ½ø³Ì
Èç¹û¿´²»µ½SecondaryNameNode½ø³Ì,ÔËÐÐÃüÁî./ 
sbin/stop-dfs.sh¹Ø±ÕHadoopÏà¹Ø½ø³Ì;È»ºó,ÔÙ´Î
³¢ÊÔÆô¶¯¡£Èç¹û¿´²»µ½NameNode»òDataNode½ø
³Ì,Ôò±íÊ¾ÅäÖÃ²»³É¹¦,×ÐÏ¸¼ì²éÖ®Ç°²½Öè,»òÍ¨¹ý²é
¿´Æô¶¯ÈÕÖ¾ÅÅ²éÔ­Òò¡£
Í¨¹ýstart-dfs.shÃüÁîÆô¶¯HadoopÒÔºó,¾Í¿ÉÒÔÔËÐÐMapReduce³ÌÐò´¦ÀíÊý¾Ý,´ËÊ±
ÊÇ¶ÔHDFS½øÐÐÊý¾Ý¶ÁÐ´,¶ø²»ÊÇ¶Ô±¾µØÎÄ¼þ½øÐÐ¶ÁÐ´¡£
4. Hadoop ÎÞ·¨Õý³£Æô¶¯µÄ½â¾ö·½·¨
Ò»°ã¿ÉÒÔÍ¨¹ý²é¿´Æô¶¯ÈÕÖ¾À´ÅÅ²éÔ­Òò¡£Æô¶¯Ê±ÆÁÄ»ÉÏ»áÏÔÊ¾ÀàËÆÈçÏÂµÄÐÅÏ¢: 
DBLab-XMU: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoopnamenode-
DBLab-XMU.out 
ÆäÖÐ,DBLab-XMU ¶ÔÓ¦µÄÊÇ»úÆ÷Ãû(ÄãµÄ»úÆ÷Ãû¿ÉÄÜ²»ÊÇÕâ¸öÃû³Æ),²»¹ý,Êµ¼ÊÉÏÆô¶¯ÈÕ
Ö¾ÐÅÏ¢ÊÇ¼ÇÂ¼ÔÚÏÂÃæÕâ¸öÎÄ¼þÖÐ: 
/usr/local/hadoop/logs/hadoop-hadoop-namenode-DBLab-XMU.log 
ËùÒÔ,Ó¦¸Ã²é¿´Õâ¸öÀ©Õ¹ÃûÎª.logµÄÎÄ¼þ,¶ø²»ÊÇ.outÎÄ¼þ¡£´ËÍâ,Ã¿Ò»´ÎµÄÆô¶¯ÈÕÖ¾
¶¼ÊÇ×·¼ÓÔÚÈÕÖ¾ÎÄ¼þÖ®ºó,ËùÒÔ,ÐèÒªÀ­µ½ÈÕÖ¾ÎÄ¼þµÄ×îºóÃæ²é¿´,¸ù¾ÝÈÕÖ¾¼ÇÂ¼µÄÊ±¼äÐÅ
Ï¢,¾Í¿ÉÒÔÕÒµ½Ä³´ÎÆô¶¯µÄÈÕÖ¾ÐÅÏ¢¡£
µ±ÕÒµ½ÊôÓÚ±¾´ÎÆô¶¯µÄÒ»¶ÎÈÕÖ¾ÐÅÏ¢ÒÔºó,³ö´íµÄÌáÊ¾ÐÅÏ¢Ò»°ã»á³öÏÖÔÚ×îºóÃæ,Í¨³£
ÊÇÐ´×ÅFatal¡¢Error¡¢Warning»òÕßJavaExceptionµÄµØ·½¡£¿ÉÒÔÔÚÍøÉÏËÑË÷Ò»ÏÂ³ö´íÐÅÏ¢, 
Ñ°ÕÒÒ»Ð©Ïà¹ØµÄ½â¾ö·½·¨¡£
Èç¹ûÖ´ÐÐjpsÃüÁîºó,ÕÒ²»µ½DataNode½ø³Ì,Ôò±íÊ¾Êý¾Ý½ÚµãÆô¶¯Ê§°Ü,¿É³¢ÊÔÈçÏÂµÄ
·½·¨(×¢ÒâÕâÊ±É¾³ýHDFSÖÐÔ­ÓÐµÄËùÓÐÊý¾Ý,Èç¹ûÔ­ÓÐµÄÊý¾ÝºÜÖØÒª,²»ÒªÕâÑù×ö,²»¹ý

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 37 
¶ÔÓÚ³õÑ§Õß¶øÑÔ,Í¨³£Õâ¸öÊ±ºò²»»áÓÐÖØÒªÊý¾Ý): 
$ ./sbin/stop-dfs.sh #¹Ø±Õ
$ rm -r ./tmp #É¾³ýtmp ÎÄ¼þ,×¢ÒâÕâÊ±É¾³ýHDFS ÖÐÔ­ÓÐµÄËùÓÐÊý¾Ý
$ ./bin/hdfs namenode -format #ÖØÐÂ¸ñÊ½»¯Ãû³Æ½Úµã
$ ./sbin/start-dfs.sh #ÖØÆô
5. Ê¹ÓÃWeb ½çÃæ²é¿´HDFS ÐÅÏ¢
Hadoop³É¹¦Æô¶¯ºó,¿ÉÒÔÔÚLinuxÏµÍ³ÖÐ(²»ÊÇWindowsÏµÍ³)´ò¿ªÒ»¸öä¯ÀÀÆ÷,ÔÚµØ
Ö·À¸ÊäÈëµØÖ·http://localhost:9870(¼ûÍ¼3-8),¾Í¿ÉÒÔ²é¿´Ãû³Æ½ÚµãºÍÊý¾Ý½ÚµãÐÅÏ¢,»¹
¿ÉÒÔÔÚÏß²é¿´HDFSÖÐµÄÎÄ¼þ¡£
Í¼3-8 HDFSµÄWeb¹ÜÀí½çÃæ
6. ÔËÐÐHadoop Î±·Ö²¼Ê½ÊµÀý
ÉÏÃæµÄµ¥»úÄ£Ê½ÖÐ,grepÀý×Ó¶ÁÈ¡µÄÊÇ±¾µØÊý¾Ý,Î±·Ö²¼Ê½Ä£Ê½ÏÂ,¶ÁÈ¡µÄÔòÊÇ·Ö²¼Ê½
ÎÄ¼þÏµÍ³HDFSÉÏµÄÊý¾Ý¡£ÒªÊ¹ÓÃHDFS,Ê×ÏÈÐèÒªÔÚHDFSÖÐ´´½¨ÓÃ»§Ä¿Â¼(±¾ÊéÈ«²¿
Í³Ò»²ÉÓÃhadoopÓÃ»§ÃûµÇÂ¼LinuxÏµÍ³),ÃüÁîÈçÏÂ: 
$ cd /usr/local/hadoop 
$ ./bin/hdfs dfs -mkdir -p /user/hadoop 
ÉÏÃæµÄÃüÁîÊÇ·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFSµÄ²Ù×÷ÃüÁî,»áÔÚ¡°µÚ4ÕÂHDFS²Ù×÷·½·¨»ù´¡
±à³Ì¡±ÖÐ×öÏêÏ¸½éÉÜ,Ä¿Ç°Ö»ÐèÒª°´ÕÕÃüÁî²Ù×÷¼´¿É¡£
½Ó×ÅÐèÒª°Ñ±¾µØÎÄ¼þÏµÍ³µÄ/usr/local/hadoop/etc/hadoopÄ¿Â¼ÖÐµÄËùÓÐXML ÎÄ¼þ
×÷ÎªÊäÈëÎÄ¼þ,¸´ÖÆµ½·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFSÖÐµÄ/user/hadoop/inputÄ¿Â¼ÖÐ,ÃüÁîÈçÏÂ: 
$ cd /usr/local/hadoop 
$ ./bin/hdfs dfs -mkdir input #ÔÚHDFS ÖÐ´´½¨hadoop ÓÃ»§¶ÔÓ¦µÄinput Ä¿Â¼
$ ./bin/hdfs dfs -put ./etc/hadoop/*.xml input #°Ñ±¾µØÎÄ¼þ¸´ÖÆµ½HDFS ÖÐ

38 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
¸´ÖÆÍê³Éºó,¿ÉÒÔÍ¨¹ýÈçÏÂÃüÁî²é¿´HDFSÖÐµÄÎÄ¼þÁÐ±í: 
$ ./bin/hdfs dfs -ls input 
Ö´ÐÐÉÏÊöÃüÁîÒÔºó,¿ÉÒÔ¿´µ½inputÄ¿Â¼ÏÂµÄÎÄ¼þÐÅÏ¢¡£ÏÖÔÚ¾Í¿ÉÒÔÔËÐÐHadoop×Ô´ø
µÄgrep³ÌÐò,ÃüÁîÈçÏÂ: 
$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop- mapreduce- examples- 3.3.5. 
jar grep input output 'dfs[a-z.]+' 
ÔËÐÐ½áÊøºó,¿ÉÒÔÍ¨¹ýÈçÏÂÃüÁî²é¿´HDFSÖÐµÄoutputÎÄ¼þ¼ÐÖÐµÄÄÚÈÝ: 
$ ./bin/hdfs dfs -cat output/* 
Ö´ÐÐ½á¹ûÈçÍ¼3-9ËùÊ¾¡£
Í¼3-9 ÔÚHadoopÎ±·Ö²¼Ê½Ä£Ê½ÏÂÔËÐÐgrepµÄ½á¹û
ÐèÒªÇ¿µ÷µÄÊÇ,HadoopÔËÐÐ³ÌÐòÊ±,Êä³öÄ¿Â¼²»ÄÜ´æÔÚ,·ñÔò»áÌáÊ¾ÈçÏÂ´íÎóÐÅÏ¢: 
org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory 
hdfs://localhost:9000/user/hadoop/output already exists 
Òò´Ë,ÈôÒªÔÙ´ÎÖ´ÐÐgrep³ÌÐò,ÐèÒªÖ´ÐÐÈçÏÂÃüÁîÉ¾³ýHDFSÖÐµÄoutputÎÄ¼þ¼Ð: 
$ ./bin/hdfs dfs -rm -r output #É¾³ýoutput ÎÄ¼þ¼Ð
7. ¹Ø±ÕHadoop 
Èç¹ûÒª¹Ø±ÕHadoop,¿ÉÒÔÖ´ÐÐÏÂÃæÃüÁî: 
$ cd /usr/local/hadoop 
$ ./sbin/stop-dfs.sh 
ÏÂ´ÎÆô¶¯HadoopÊ±,ÎÞÐë½øÐÐÃû³Æ½ÚµãµÄ³õÊ¼»¯(·ñÔò»á³ö´í),Ò²¾ÍÊÇËµ,²»ÒªÔÙ´Î
Ö´ÐÐhdfsnamenode-formatÃüÁî,Ã¿´ÎÆô¶¯HadoopÖ»ÐèÒªÖ±½ÓÔËÐÐstart-dfs.shÃüÁî
¼´¿É¡£
8. ÅäÖÃPATH ±äÁ¿
Ç°ÃæÔÚÆô¶¯HadoopÊ±,¶¼Òª¼ÓÉÏÃüÁîµÄÂ·¾¶,ÀýÈç,./sbin/start-dfs.shÕâ¸öÃüÁîÖÐ¾Í
´øÉÏÁËÂ·¾¶,Êµ¼ÊÉÏ,Í¨¹ýÉèÖÃPATH ±äÁ¿,¾Í¿ÉÒÔÔÚÖ´ÐÐÃüÁîÊ±,²»ÓÃ´øÉÏÃüÁî±¾ÉíËùÔÚ
µÄÂ·¾¶¡£ÀýÈç,´ò¿ªÒ»¸öLinuxÖÕ¶Ë,ÔÚÈÎºÎÒ»¸öÄ¿Â¼ÏÂÖ´ÐÐlsÃüÁîÊ±,¶¼Ã»ÓÐ´øÉÏlsÃüÁî
µÄÂ·¾¶,Êµ¼ÊÉÏ,Ö´ÐÐlsÃüÁîÊ±,ÊÇÖ´ÐÐ/bin/lsÕâ¸ö³ÌÐò,Ö®ËùÒÔ²»ÐèÒª´øÉÏÂ·¾¶,ÊÇÒòÎª

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 39 
LinuxÏµÍ³ÒÑ¾­°ÑlsÃüÁîµÄÂ·¾¶¼ÓÈëµ½PATH ±äÁ¿ÖÐ,µ±Ö´ÐÐlsÃüÁîÊ±,ÏµÍ³ÊÇ¸ù¾Ý
PATH Õâ¸ö»·¾³±äÁ¿°üº¬µÄÄ¿Â¼Î»ÖÃ,ÖðÒ»½øÐÐ²éÕÒ,Ö±ÖÁÔÚÕâÐ©Ä¿Â¼Î»ÖÃÏÂÕÒµ½Æ¥ÅäµÄ
ls³ÌÐò(ÈôÃ»ÓÐÆ¥ÅäµÄ³ÌÐò,ÔòÏµÍ³»áÌáÊ¾¸ÃÃüÁî²»´æÔÚ)¡£
ÖªµÀÁËÕâ¸öÔ­ÀíÒÔºó,Í¬Ñù¿ÉÒÔ°Ñstart-dfs.sh¡¢stop-dfs.shµÈÃüÁîËùÔÚµÄÄ¿Â¼/usr/ 
local/hadoop/sbin,¼ÓÈë»·¾³±äÁ¿PATH ÖÐ,ÕâÑù,ÒÔºóÔÚÈÎºÎÄ¿Â¼ÏÂ¶¼¿ÉÒÔÖ±½ÓÊ¹ÓÃÃüÁî
start-dfs.shÆô¶¯Hadoop,²»ÓÃ´øÉÏÃüÁîÂ·¾¶¡£¾ßÌå²Ù×÷·½·¨ÊÇ,Ê×ÏÈÊ¹ÓÃvim ±à¼­Æ÷´ò¿ª
~/.bashrcÕâ¸öÎÄ¼þ;È»ºó,ÔÚÕâ¸öÎÄ¼þµÄ×îÇ°ÃæÎ»ÖÃ¼ÓÈëÈçÏÂµ¥¶ÀÒ»ÐÐ: 
export PATH=$PATH:/usr/local/hadoop/sbin 
ÔÚºóÃæµÄÑ§Ï°¹ý³ÌÖÐ,Èç¹ûÒª¼ÌÐø°ÑÆäËûÃüÁîµÄÂ·¾¶Ò²¼ÓÈëPATH ±äÁ¿ÖÐ,Ò²ÐèÒª¼Ì
ÐøÐÞ¸Ä~/.bashrcÕâ¸öÎÄ¼þ¡£µ±ºóÃæÒª¼ÌÐø¼ÓÈëÐÂµÄÂ·¾¶Ê±,Ö»ÒªÓÃÓ¢ÎÄÃ°ºÅ(:)¸ô¿ª,°Ñ
ÐÂµÄÂ·¾¶¼Óµ½ºóÃæ¼´¿É,ÀýÈç,Èç¹ûÒª¼ÌÐø°Ñ/usr/local/hadoop/binÂ·¾¶Ôö¼Óµ½PATH ÖÐ, 
Ö»Òª¼ÌÐø×·¼Óµ½ºóÃæ,ÈçÏÂËùÊ¾: 
export PATH=$PATH:/usr/local/hadoop/sbin:/usr/local/hadoop/bin 
Ìí¼Óºó,Ö´ÐÐÃüÁîsource ~/.bashrcÊ¹ÉèÖÃÉúÐ§¡£ÉèÖÃÉúÐ§ºó,ÔÚÈÎºÎÄ¿Â¼ÏÂÆô¶¯
Hadoop,¶¼Ö»ÒªÖ±½ÓÊäÈëstart-dfs.shÃüÁî¼´¿É¡£Í¬Àí,Í£Ö¹Hadoop,Ò²Ö»ÐèÒªÔÚÈÎºÎÄ¿Â¼
ÏÂÊäÈëstop-dfs.shÃüÁî¼´¿É¡£
3.3.4 ·Ö²¼Ê½Ä£Ê½ÅäÖÃ
µ±Hadoop²ÉÓÃ·Ö²¼Ê½Ä£Ê½²¿ÊðºÍÔËÐÐÊ±,´æ´¢²ÉÓÃ·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFS,¶øÇÒ, 
HDFSµÄÃû³Æ½ÚµãºÍÊý¾Ý½ÚµãÎ»ÓÚ²»Í¬»úÆ÷ÉÏ¡£ÕâÊ±,Êý¾Ý¾Í¿ÉÒÔ·Ö²¼µ½¶à¸ö½ÚµãÉÏ,²»Í¬
Êý¾Ý½ÚµãÉÏµÄÊý¾Ý¼ÆËã¿ÉÒÔ²¢ÐÐÖ´ÐÐ,ÕâÊ±µÄMapReduce·Ö²¼Ê½¼ÆËãÄÜÁ¦²ÅÄÜÕæÕý·¢»Ó
×÷ÓÃ¡£Õâ
ÀïÊ¹ÓÃ3 ¸ö½Úµã(Á½Ì¨ÎïÀí»úÆ÷)À´´î½¨¼¯Èº»·¾³,Ö÷»úÃû·Ö±ðÎªhadoop01¡¢
hadoop02ºÍhadoop03¡£3¸ö½ÚµãÉÏµÄHadoop×é¼þ·Ö²¼Èç±í3-1ËùÊ¾¡£
±í3-1 Hadoop¼¯Èº×é¼þ·Ö²¼
Ãû ³Æhadoop01 hadoop02 hadoop03 
HDFS NameNode 
DataNode DataNode DataNode 
SecondaryNameNode 
YARN ResourceManager 
NodeManager NodeManager NodeManager 
1. °²×°ÐéÄâ»ú
´ËÇ°,ÔÚ2.2.3½Ú°²×°LinuxÐéÄâ»úÕâ²¿·ÖÄÚÈÝÖÐ,ÒÑ¾­°²×°ÁËÐéÄâ»úhadoop01,°´ÕÕ
ÏàÍ¬µÄ·½·¨ÔÙ°²×°ÁíÍâÁ½¸öÐéÄâ»úhadoop02ºÍhadoop03,»òÕßÒ²¿ÉÒÔ²ÉÓÃ¡°¿ËÂ¡¡±ÐéÄâ»ú
µÄ·½Ê½¿ìËÙÉú³ÉÁ½¸öÐÂµÄÐéÄâ»ú¡£ÓÉÓÚhadoop02ºÍhadoop03ÊÇ´Ó½Úµã,²»ÐèÒª°²×°ºÜ¶à
µÄÈí¼þ,ËùÒÔ,ÅäÖÃ¿ÉÒÔ±Èhadoop01µÍÒ»Ð©,ÀýÈç,¶ÔÓÚhadoop02ºÍhadoop03¶øÑÔ,ÄÚ´æÖ»

40 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
ÐèÒªÅäÖÃ4GB,´ÅÅÌÖ»ÐèÒªÅäÖÃ20GB¡£
°²×°ºÃÐéÄâ»úhadoop02ºÍhadoop03ÒÔºó,²ÎÕÕ3.2.2½ÚµÄ·½·¨,Ê×ÏÈ´´½¨hadoopÓÃ
»§,È»ºóÊ¹ÓÃhadoopÓÃ»§µÇÂ¼LinuxÏµÍ³,°²×°SSH ·þÎñ¶Ë,²¢°²×°Java»·¾³¡£
2. ÍøÂçÅäÖÃ
ÔÚUbuntuÖÐ,ÔÚhadoop01½ÚµãÉÏÖ´ÐÐÈçÏÂÃüÁîÐÞ¸ÄÖ÷»úÃû: 
$ sudo vim /etc/hostname 
Ö´ÐÐÉÏÃæÃüÁîºó,¾Í´ò¿ªÁË/etc/hostnameÕâ¸öÎÄ¼þ,Õâ¸öÎÄ¼þÀïÃæ¼ÇÂ¼ÁËÖ÷»úÃû¡£Òò
´Ë,´ò¿ªÕâ¸öÎÄ¼þÒÔºó,ÀïÃæ¾ÍÖ»ÓÐubuntuÕâÒ»ÐÐÄÚÈÝ,¿ÉÒÔÖ±½ÓÉ¾³ý,²¢ÐÞ¸ÄÎªhadoop01 
(×¢ÒâÊÇÇø·Ö´óÐ¡Ð´µÄ),È»ºó,±£´æÍË³övim ±à¼­Æ÷,ÕâÑù¾ÍÍê³ÉÁËÖ÷»úÃûµÄÐÞ¸Ä,ÐèÒªÖØ
ÆôLinuxÏµÍ³²ÅÄÜ¿´µ½Ö÷»úÃûµÄ±ä»¯¡£
Òª×¢Òâ¹Û²ìÖ÷»úÃûÐÞ¸ÄÇ°ºóµÄ±ä»¯¡£ÔÚÐÞ¸ÄÖ÷»úÃûÖ®Ç°,Èç¹ûÓÃhadoopµÇÂ¼LinuxÏµ
Í³,´ò¿ªÖÕ¶Ë,½øÈëShellÃüÁîÌáÊ¾·û×´Ì¬,»áÏÔÊ¾ÈçÏÂÄÚÈÝ: 
hadoop@ ubuntu:~$ 
ÐÞ¸ÄÖ÷»úÃû²¢ÇÒÖØÆôLinuxÏµÍ³Ö®ºó,ÓÃhadoopµÇÂ¼LinuxÏµÍ³,´ò¿ªÖÕ¶Ë,½øÈë
ShellÃüÁîÌáÊ¾·û×´Ì¬,»áÏÔÊ¾ÈçÏÂÄÚÈÝ: 
hadoop@ hadoop01:~$ 
Í¬Àí,°´ÕÕÏàÍ¬µÄ·½·¨,°ÑÐéÄâ»úhadoop02 ºÍhadoop03 ÖÐµÄÖ÷»úÃû·Ö±ðÐÞ¸ÄÎª
hadoop02ºÍhadoop03,²¢ÖØÆôLinuxÏµÍ³¡£
È»ºó,Ê¹ÓÃifconfigÃüÁî»ñÈ¡Ã¿Ì¨ÐéÄâ»úµÄIPµØÖ·,¾ßÌåÃüÁîÈçÏÂ: 
$ ifconfig 
Í¼3-10¸ø³öifconfigÃüÁîµÄÖ´ÐÐÐ§¹û,´ÓÖÐ¿ÉÒÔ¿´µ½,hadoop01µÄIPµØÖ·ÊÇ192.168.91.128 
(ÄãµÄ»úÆ÷µÄIPµØÖ·¿ÉÄÜºÍÕâ¸ö²»Í¬)¡£Í¬Àí,¿ÉÒÔ²éÑ¯µ½hadoop02µÄIPµØÖ·ÊÇ192.168.91.129 
(ÄãµÄ»úÆ÷µÄIPµØÖ·¿ÉÄÜºÍÕâ¸ö²»Í¬),hadoop03µÄIPµØÖ·ÊÇ192.168.91.130(ÄãµÄ»úÆ÷µÄ
IPµØÖ·¿ÉÄÜºÍÕâ¸ö²»Í¬)¡£
Í¼3-10 ifconfigÃüÁîÖ´ÐÐÐ§¹û
ÐèÒª×¢ÒâµÄÊÇ,½¨Òé½«Ã¿Ì¨»úÆ÷µÄIPµØÖ·ÉèÖÃÎª¹Ì¶¨IPµØÖ·,²»ÒªÊ¹ÓÃ¶¯Ì¬·ÖÅäIP 
µØÖ·,·ñÔò,Ã¿´ÎÖØÆôÏµÍ³ÒÔºóÓÐ¿ÉÄÜIPµØÖ·»á¶¯Ì¬±ä»¯,µ¼ÖÂºóÃæ´î½¨µÄ¼¯ÈºÎÞ·¨Á¬½Ó¡£

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 41 
ÏÂÃæ½éÉÜ°Ñ»úÆ÷µÄIPµØÖ·ÉèÖÃÎª¹Ì¶¨IPµØÖ·µÄ·½·¨¡£
ÔÚUbuntuÏµÍ³ÖÐÐÂ½¨Ò»¸öÖÕ¶Ë,Ö´ÐÐÈçÏÂÃüÁî²éÑ¯Íø¹ØµØÖ·: 
$ netstat -nr 
²éÑ¯½á¹ûÈçÍ¼3-11ËùÊ¾,´ÓÍ¼ÖÐ¿ÉÒÔ¿´µ½,Íø¹ØÊÇ192.168.91.2¡£
Í¼3-11 ²éÑ¯Íø¹ØµØÖ·
µ¥»÷UbuntuÏµÍ³½çÃæÓÒÉÏ½ÇµÄ³ÝÂÖ(¼ûÍ¼3-12),ÔÚµ¯³öµÄ²Ëµ¥ÖÐÑ¡ÔñSystemSettings 
ÃüÁî¡£
Í¼3-12 ´ò¿ªÏµÍ³ÉèÖÃ
ÔÚ³öÏÖµÄ½çÃæÖÐ(¼ûÍ¼3-13),µ¥»÷Network°´Å¥¡£
Í¼3-13 ´ò¿ªÍøÂçÉèÖÃ
ÔÚ³öÏÖµÄ½çÃæÖÐ(¼ûÍ¼3-14),µ¥»÷Options°´Å¥¡£
ÔÚ³öÏÖµÄ½çÃæÖÐ(¼ûÍ¼3-15),ÔÚMethodÓÒ±ßµÄÏÂÀ´ÁÐ±íÖÐÑ¡ÔñManual,È»ºó,°Ñ
AddressÉèÖÃÎª192.168.91.128,°ÑNetmaskÉèÖÃÎª255.255.255.0,°ÑGatewayÉèÖÃÎª
192.168.91.2,°ÑDNSserversÉèÖÃÎª114.114.114.114,×îºóµ¥»÷½çÃæµ×²¿µÄSave°´Å¥¡£È»
ºó,ÖØÐÂÆô¶¯UbuntuÏµÍ³,IPµØÖ·¾ÍÉúÐ§ÁË¡£×¢Òâ,ÏµÍ³ÖØÆôÒÔºó,Ò»¶¨ÒªÊ¹ÓÃifconfigÃü
Áî¼ì²éIPµØÖ·ÊÇ·ñÒÑ¾­ÉèÖÃ³É¹¦,Í¬Ê±,Ò²ÒªÔÚUbuntuÖÐ´ò¿ªÒ»¸öä¯ÀÀÆ÷,²âÊÔÒ»ÏÂÊÇ·ñ

42 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
Í¼3-14 µ¥»÷Options°´Å¥
¿ÉÒÔÕý³£·ÃÎÊÍøÂç(Èç·ÃÎÊ°Ù¶ÈÍøÕ¾)¡£
Í¼3-15 IPµØÖ·ÉèÖÃ½çÃæ
È»ºó,ÔÚhadoop01ÖÐ,Ö´ÐÐÈçÏÂÃüÁî´ò¿ª²¢ÐÞ¸Ä/etc/hostsÎÄ¼þ: 
$ sudo vim /etc/hosts 
¿ÉÒÔÔÚhostsÎÄ¼þÖÐÔö¼ÓÈçÏÂ3ÌõIPºÍÖ÷»úÃûÓ³Éä¹ØÏµ: 
192.168.91.128 hadoop01 
192.168.91.129 hadoop02 
192.168.91.130 hadoop03 
ÐÞ¸ÄºóµÄÐ§¹ûÈçÍ¼3-16ËùÊ¾¡£
ÐèÒª×¢ÒâµÄÊÇ,Ò»°ãhostsÎÄ¼þÖÐÖ»ÄÜÓÐÒ»¸ö127.0.0.1,Æä¶ÔÓ¦Ö÷»úÃûÎªlocalhost,Èç
¹ûÓÐ¶àÓà127.0.0.1Ó³Éä,Ó¦É¾³ý,ÌØ±ðÊÇ²»ÄÜ´æÔÚ127.0.0.1hadoop01ÕâÑùµÄÓ³Éä¼ÇÂ¼¡£
ÐÞ¸ÄºóÐèÒªÖØÆôLinuxÏµÍ³¡£
ÉÏÃæÍê³ÉÁËhadoop01µÄÅäÖÃ,½ÓÏÂÀ´Òª¼ÌÐøÍê³É¶ÔÆäËû½ÚµãµÄÅäÖÃÐÞ¸Ä¡£²ÎÕÕÉÏÃæµÄ

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 43 
Í¼3-16 ÐÞ¸ÄIPºÍÖ÷»úÃûÓ³Éä¹ØÏµºóµÄÐ§¹û
·½·¨,·Ö±ðµ½hadoop02ºÍhadoop03ÖÐ,ÔÚhostsÎÄ¼þÖÐÔö¼ÓÈçÏÂ3ÌõIP ºÍÖ÷»úÃûÓ³Éä
¹ØÏµ: 
192.168.91.128 hadoop01 
192.168.91.129 hadoop02 
192.168.91.130 hadoop03 
ÐÞ¸ÄÍê³ÉÒÔºó,ÖØÐÂÆô¶¯LinuxÏµÍ³¡£
ÐèÒªÔÚ¸÷¸ö½ÚµãÉÏ¶¼Ö´ÐÐÈçÏÂÃüÁî,²âÊÔÊÇ·ñÏà»¥pingµÃÍ¨,Èç¹ûping²»Í¨,ºóÃæ¾Í
ÎÞ·¨Ë³ÀûÅäÖÃ³É¹¦¡£ÔÚÃ¿¸ö½ÚµãÉÏ¶¼Ö´ÐÐÏÂÃæ3ÌõÃüÁî: 
$ ping hadoop01 -c 3 #Ö»ping 3 ´Î¾Í»áÍ£Ö¹,·ñÔòÒª°´×éºÏ¼üCtrl+C ÖÐ¶Ïping ÃüÁî
$ ping hadoop02 -c 3 
$ ping hadoop03 -c 3 
ÀýÈç,ÔÚhadoop01½ÚµãÉÏÖ´ÐÐpingÃüÁî,Èç¹ûpingÍ¨µÄ»°,»áÏÔÊ¾Í¼3-17ËùÊ¾µÄ
½á¹û¡£
Í¼3-17 Ê¹ÓÃpingÃüÁîµÄÐ§¹û
3. SSH ÎÞÃÜÂëµÇÂ¼½Úµã
±ØÐëÒªÈÃhadoop01½Úµã¿ÉÒÔSSH ÎÞÃÜÂëµÇÂ¼µ½¸÷¸ö½ÚµãÉÏ(°üÀ¨hadoop01¿ÉÒÔ
SSH ÎÞÃÜÂëµÇÂ¼×Ô¼º)¡£
Ê×ÏÈÐèÒªÔÙ´ÎÈ·ÈÏ3¸ö½ÚµãÉÏÒÑ¾­°²×°ÁËSSH ·þÎñ¶Ë,Èç¹ûÖ®Ç°Ã»ÓÐ°²×°,ÐèÒªÖ´ÐÐ
ÈçÏÂÃüÁî°²×°SSH ·þÎñ¶Ë(Èç¹û´ËÇ°ÒÑ¾­°²×°¾Í²»ÓÃÖØ¸´°²×°): 
$ sudo apt-get install openssh-server

44 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
È»ºó,Éú³Éhadoop01½ÚµãµÄ¹«Ô¿,Èç¹ûÖ®Ç°ÒÑ¾­Éú³É¹ý¹«Ô¿(ÔÚ3.3.3½Ú°²×°Î±·Ö²¼Ê½
Ä£Ê½µÄHadoopÊ±Éú³É¹ýÒ»´Î¹«Ô¿),±ØÐëÒªÉ¾³ýÔ­À´Éú³ÉµÄ¹«Ô¿,ÖØÐÂÉú³ÉÒ»´Î,ÒòÎªÇ°Ãæ
¶ÔÖ÷»úÃû½øÐÐÁËÐÞ¸Ä¡£ÔÚhadoop01½ÚµãÖ´ÐÐÈçÏÂÃüÁî: 
$ cd ~/.ssh #Èç¹ûÃ»ÓÐ¸ÃÄ¿Â¼,ÏÈÖ´ÐÐÒ»´Îssh localhost 
$ rm ./id_rsa* #É¾³ýÖ®Ç°Éú³ÉµÄ¹«Ô¿(Èç¹ûÒÑ¾­´æÔÚ) 
$ ssh-keygen -t rsa #Ö´ÐÐ¸ÃÃüÁîºó,Óöµ½ÌáÊ¾ÐÅÏ¢,Ò»Ö±°´Enter ¼ü¾Í¿ÉÒÔ
ÎªÁËÈÃhadoop01½ÚµãÄÜ¹»ÎÞÃÜÂëSSH µÇÂ¼±¾»ú,ÐèÒªÔÚhadoop01½ÚµãÉÏÖ´ÐÐÈçÏÂÃüÁî: 
$ cat ./id_rsa.pub >> ./authorized_keys 
Íê³Éºó¿ÉÒÔÖ´ÐÐÃüÁîsshhadoop01À´ÑéÖ¤Ò»ÏÂ,¿ÉÄÜ»áÓöµ½ÌáÊ¾ÐÅÏ¢,Ö»ÒªÊäÈëyes¼´
¿É,²âÊÔ³É¹¦ºó,Ö´ÐÐexitÃüÁî·µ»ØÔ­À´µÄÖÕ¶Ë¡£
½ÓÏÂÀ´,ÔÚhadoop01½Úµã½«ÉÏ¹«Ô¿´«Êäµ½hadoop02ºÍhadoop03½Úµã: 
$ scp ~/.ssh/id_rsa.pub hadoop@hadoop02:/home/hadoop/ 
$ scp ~/.ssh/id_rsa.pub hadoop@hadoop03:/home/hadoop/ 
ÉÏÃæµÄÃüÁîÖÐ,scpÊÇsecurecopyµÄ¼òÐ´,ÓÃÓÚÔÚLinuxÏÂ½øÐÐÔ¶³Ì¸´ÖÆÎÄ¼þ,ÀàËÆÓÚ
cpÃüÁî,²»¹ý,cpÖ»ÄÜÔÚ±¾»úÖÐ¸´ÖÆ¡£Ö´ÐÐscpÊ±»áÒªÇóÊäÈëhadoop02ºÍhadoop03½Úµã
ÉÏhadoopÓÃ»§µÄÃÜÂë,ÊäÈëÍê³Éºó»áÌáÊ¾´«ÊäÍê±Ï,ÈçÍ¼3-18ËùÊ¾¡£´«ÊäÍê³ÉÒÔºó,ÔÚ
hadoop02ºÍhadoop03½ÚµãÉÏµÄ/home/hadoopÄ¿Â¼ÏÂ¾Í¿ÉÒÔ¿´µ½ÎÄ¼þid_rsa.pubÁË¡£
Í¼3-18 Ö´ÐÐscpÃüÁîµÄÐ§¹û
½Ó×ÅÔÚ½Úµãhadoop02ºÍhadoop03ÉÏ·Ö±ðÖ´ÐÐÈçÏÂÃüÁî½«SSH ¹«Ô¿¼ÓÈëÊÚÈ¨: 
$ mkdir ~/.ssh #Èç¹û²»´æÔÚ¸ÃÎÄ¼þ¼ÐÐèÏÈ´´½¨,ÈôÒÑ´æÔÚ,ÔòºöÂÔ±¾ÃüÁî
$ cat ~/id_rsa.pub >> ~/.ssh/authorized_keys 
$ rm ~/id_rsa.pub #ÓÃÍêÒÔºó¾Í¿ÉÒÔÉ¾µô
ÕâÑù,ÔÚhadoop01 ½ÚµãÉÏ¾Í¿ÉÒÔÎÞÃÜÂëSSH µÇÂ¼µ½¸÷¸ö½ÚµãÁË(°üÀ¨hadoop01¡¢
hadoop02ºÍhadoop03),¿ÉÔÚhadoop01½ÚµãÉÏÖ´ÐÐÈçÏÂÃüÁî½øÐÐ¼ìÑé: 
$ ssh hadoop02 
$ ssh hadoop03 
Ö´ÐÐ¸ÃÃüÁîµÄÐ§¹ûÈçÍ¼3-19ËùÊ¾¡£
4. ÏÂÔØ°²×°ÎÄ¼þ
Èç¹ûhadoop01½ÚµãÉÏÒÑ¾­°²×°ÁËHadoop(ÈçÖ®Ç°°²×°¹ýÎ±·Ö²¼Ê½µÄHadoop),ÐèÒª

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 45 
Í¼3-19 sshÃüÁîÖ´ÐÐÐ§¹û
ÏÈ½«ÆäÉ¾³ý¡£
ÔÚhadoop01½ÚµãÉÏÏÂÔØHadoop°²×°ÎÄ¼þ,²¢Ö´ÐÐÈçÏÂÃüÁî: 
$ sudo tar -zxvf ~/Downloads/hadoop-3.3.5.tar.gz -C /usr/local 
#½âÑ¹µ½/usr/local ÖÐ
$ cd /usr/local/ 
$ sudo mv ./hadoop-3.3.5/ ./hadoop #½«ÎÄ¼þ¼ÐÃû¸ÄÎªhadoop 
$ sudo chown -R hadoop:hadoop ./hadoop # ÐÞ¸ÄÎÄ¼þÈ¨ÏÞ
5. ÅäÖÃPATH ±äÁ¿
ÔÚÇ°ÃæµÄÎ±·Ö²¼Ê½°²×°ÄÚÈÝÖÐ,ÒÑ¾­½éÉÜ¹ýPATH ±äÁ¿µÄÅäÖÃ·½·¨¡£¿ÉÒÔ°´ÕÕÍ¬ÑùµÄ
·½·¨½øÐÐÅäÖÃ,ÕâÑù¾Í¿ÉÒÔÔÚÈÎÒâÄ¿Â¼ÖÐÖ±½ÓÊ¹ÓÃhadoop¡¢hdfsµÈÃüÁîÁË¡£Èç¹û»¹Ã»ÓÐÅä
ÖÃPATH ±äÁ¿,ÄÇÃ´ÐèÒªÔÚhadoop01½ÚµãÉÏ½øÐÐÅäÖÃ¡£Ê×ÏÈÖ´ÐÐÃüÁîvim ~/.bashrc,Ò²
¾ÍÊÇÊ¹ÓÃvim ±à¼­Æ÷´ò¿ª~/.bashrcÎÄ¼þ,È»ºó,ÔÚ¸ÃÎÄ¼þ×îÉÏÃæµÄÎ»ÖÃ¼ÓÈëÏÂÃæÒ»ÐÐ
ÄÚÈÝ: 
export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin 
±£´æºóÖ´ÐÐÃüÁîsource~/.bashrc,Ê¹ÅäÖÃÉúÐ§¡£
6. ÅäÖÃ¼¯Èº/·Ö²¼Ê½»·¾³
ÔÚÅäÖÃ¼¯Èº/·Ö²¼Ê½Ä£Ê½Ê±,ÐèÒªÐÞ¸Ä/usr/local/hadoop/etc/hadoopÄ¿Â¼ÏÂµÄÅäÖÃÎÄ
¼þ,ÕâÀï½öÉèÖÃÕý³£Æô¶¯Ëù±ØÐèµÄÉèÖÃÏî,°üÀ¨workers¡¢core-site.xml¡¢hdfs-site.xml¡¢
mapred-site.xmlºÍyarn-site.xml¹²5¸öÎÄ¼þ,¸ü¶àÉèÖÃÏî¿É²é¿´¹Ù·½ËµÃ÷¡£
(1)ÐÞ¸ÄÎÄ¼þworkers¡£
ÐèÒª°ÑËùÓÐÊý¾Ý½ÚµãµÄÖ÷»úÃûÐ´Èë¸ÃÎÄ¼þ,Ã¿ÐÐÒ»¸ö¡£°Ñhadoop01½ÚµãÖÐµÄworkers 
ÎÄ¼þÖÐÔ­À´µÄlocalhostÉ¾³ý,Ìí¼ÓÈçÏÂ3ÐÐÄÚÈÝ: 
hadoop01 
hadoop02 
hadoop03 
(2)ÐÞ¸ÄÎÄ¼þcore-site.xml¡£
°Ñhadoop01½ÚµãÖÐµÄcore-site.xmlÎÄ¼þÐÞ¸ÄÎªÈçÏÂÄÚÈÝ:

46 ´óÊý¾Ý»ù´¡±à³Ì¡¢ÊµÑéºÍ°¸Àý½Ì³Ì£¨µÚ3 °æ£© 
<configuration> 
<property> 
<name>fs.defaultFS</name> 
<value>hdfs://hadoop01:9000</value> 
</property> 
<property> 
<name>hadoop.tmp.dir</name> 
<value>file:/usr/local/hadoop/tmp</value> 
<description>Abase for other temporary directories.</description> 
</property> 
</configuration> 
¸÷¸öÅäÖÃÏîµÄº¬Òå¿ÉÒÔ²Î¿¼Ç°ÃæÎ±·Ö²¼Ê½Ä£Ê½Ê±µÄ½éÉÜ,ÕâÀï²»ÔÙ×¸Êö¡£
(3)ÐÞ¸ÄÎÄ¼þhdfs-site.xml¡£
¶ÔÓÚHadoopµÄ·Ö²¼Ê½ÎÄ¼þÏµÍ³HDFS¶øÑÔ,Ò»°ã¶¼ÊÇ²ÉÓÃÈßÓà´æ´¢,ÈßÓàÒò×ÓÍ¨³£Îª
3,Ò²¾ÍÊÇËµ,Ò»·ÝÊý¾Ý±£´æ3·Ý¸±±¾,ËùÒÔ,dfs.replicationµÄÖµÉèÖÃÎª3¡£°Ñhadoop01½Úµã
ÖÐµÄhdfs-site.xmlÉèÖÃÎªÈçÏÂÄÚÈÝ: 
<configuration> 
<property> 
<name>dfs.namenode.secondary.http-address</name> 
<value>hadoop03:50090</value> 
</property> 
<property> 
<name>dfs.replication</name> 
<value>3</value> 
</property> 
<property> 
<name>dfs.namenode.name.dir</name> 
<value>file:/usr/local/hadoop/tmp/dfs/name</value> 
</property> 
<property> 
<name>dfs.datanode.data.dir</name> 
<value>file:/usr/local/hadoop/tmp/dfs/data</value> 
</property> 
</configuration> 
(4)ÐÞ¸ÄÎÄ¼þmapred-site.xml¡£
hadoop01½ÚµãÖÐµÄ/usr/local/hadoop/etc/hadoopÄ¿Â¼ÏÂÓÐÒ»¸ömapred-site.xml,°Ñ
mapred-site.xmlÎÄ¼þÅäÖÃ³ÉÈçÏÂÄÚÈÝ: 
<configuration> 
<property> 
<name>mapreduce.framework.name</name> 
<value>yarn</value> 
</property> 
<property> 
<name>mapreduce.jobhistory.address</name>

µÚ3 ÕÂ¡¡Hadoop µÄ°²×°ºÍÊ¹ÓÃ 47 
<value>hadoop01:10020</value> 
</property> 
<property> 
<name>mapreduce.jobhistory.webapp.address</name> 
<value>hadoop01:19888</value> 
</property> 
<property> 
<name>yarn.app.mapreduce.am.env</name> 
<value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value> 
</property> 
<property> 
<name>mapreduce.map.env</name> 
<value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value> 
</property> 
<property> 
<name>mapreduce.reduce.env</name> 
<value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value> 
</property> 
</configuration> 
(5)ÐÞ¸ÄÎÄ¼þyarn-site.xml¡£
°Ñhadoop01½ÚµãÖÐµÄyarn-site.xmlÎÄ¼þÅäÖÃ³ÉÈçÏÂÄÚÈÝ: 
<configuration> 
<property> 
<name>yarn.resourcemanager.hostname</name> 
<value>hadoop01</value> 
</property> 
<property> 
<name>yarn.nodemanager.aux-services</name> 
<value>mapreduce_shuffle</value> 
</property> 
</configuration> 
ÉÏÊö5¸öÎÄ¼þÈ«²¿ÅäÖÃÍê³ÉÒÔºó,ÐèÒª°Ñhadoop01½ÚµãÉÏµÄ/usr/local/hadoopÎÄ¼þ
¼Ð¸´ÖÆµ½¸÷¸ö½ÚµãÉÏ¡£Èç¹ûÖ®Ç°ÒÑ¾­ÔËÐÐ¹ýÎ±·Ö²¼Ê½Ä£Ê½,½¨ÒéÔÚÇÐ»»µ½¼¯ÈºÄ£Ê½Ö®Ç°Ê×
ÏÈÉ¾³ýÖ®Ç°ÔÚÎ±·Ö²¼Ê½Ä£Ê½ÏÂÉú³ÉµÄÁÙÊ±ÎÄ¼þ¡£¾ßÌåÀ´Ëµ,ÐèÒªÊ×ÏÈÔÚhadoop01½ÚµãÉÏÖ´
ÐÐÈçÏÂÃüÁî: 
$ cd /usr/local/hadoop 
$ sudo rm -r ./tmp #É¾³ýHadoop ÁÙÊ±ÎÄ¼þ
$ sudo rm -r ./logs/* #É¾³ýÈÕÖ¾ÎÄ¼þ
$ cd /usr/local 
$ tar -zcf ~/hadoop.master.tar.gz ./hadoop #ÏÈÑ¹ËõÔÙ¸´ÖÆ
$ cd ~ 
$ scp ./hadoop.master.tar.gz hadoop02:/home/hadoop 
$ scp ./hadoop.master.tar.gz hadoop03:/home/hadoop