»ùÓÚhadoopÉúÌ¬È¦µÄÊý¾Ý²Ö¿âÊµ¼ù ¡ª OLAPÓëÊý¾Ý¿ÉÊÓ»¯£¨¶þ£©

168Ö÷±à ·¢±íÓÚ 2018-12-27 16:28:47

±¾Ìû×îºóÓÉ 168Ö÷±à ÓÚ 2018-12-27 16:31 ±à¼

ËÄ¡¢Êý¾Ý¿ÉÊÓ»¯ÓëHue¼ò½é
1. Êý¾Ý¿ÉÊÓ»¯¼ò½é
   Êý¾Ý¿ÉÊÓ»¯ÔÚÎ¬»ù°Ù¿ÆÉÏÊÇÕâÑù¶¨ÒåµÄ£ºÖ¸Ò»ÖÖ±íÊ¾Êý¾Ý»òÐÅÏ¢µÄ¼¼Êõ£¬Ëü½«Êý¾Ý»òÐÅÏ¢±àÂëÎª°üº¬ÔÚÍ¼ÐÎÀïµÄ¿É¼û¶ÔÏó£¨Èçµã¡¢Ïß¡¢ÌõµÈ£©£¬Ä¿µÄÊÇ½«ÐÅÏ¢¸ü¼ÓÇåÎúÓÐÐ§µØ´«´ï¸øÓÃ»§£¬ÊÇÊý¾Ý·ÖÎö»òÊý¾Ý¿ÆÑ§µÄ¹Ø¼ü¼¼ÊõÖ®Ò»¡£¼òµ¥µØËµ£¬Êý¾Ý¿ÉÊÓ»¯¾ÍÊÇÒÔÍ¼ÐÎ»¯·½Ê½±íÊ¾Êý¾Ý¡£¾ö²ßÕß¿ÉÒÔÍ¨¹ýÍ¼ÐÎÖ±¹ÛµØ¿´µ½Êý¾Ý·ÖÎö½á¹û£¬´Ó¶ø¸üÈÝÒ×Àí½âÒµÎñ±ä»¯Ç÷ÊÆ»ò·¢ÏÖÐÂµÄÒµÎñÄ£Ê½¡£Ê¹ÓÃ¿ÉÊÓ»¯¹¤¾ß£¬¿ÉÒÔÔÚÍ¼ÐÎ»òÍ¼±íÉÏ½øÐÐÏÂ×ê£¬ÒÔ½øÒ»²½»ñµÃ¸üÏ¸½ÚµÄÐÅÏ¢£¬½»»¥Ê½µØ¹Û²ìÊý¾Ý¸Ä±äºÍ´¦Àí¹ý³Ì¡£

£¨1£©Êý¾Ý¿ÉÊÓ»¯µÄÖØÒªÐÔ
   ´ÓÈËÀà´óÄÔ´¦ÀíÐÅÏ¢µÄ·½Ê½¿´£¬Ê¹ÓÃÍ¼ÐÎÍ¼±í¹Û²ì´óÁ¿¸´ÔÓÊý¾ÝÒª±È²é¿´µç×Ó±í¸ñ»ò±¨±í¸üÈÝÒ×Àí½â¡£Êý¾Ý¿ÉÊÓ»¯¾ÍÊÇÕâÑùÒ»ÖÖÒÔ×îÎªÆÕÍ¨µÄ·½Ê½£¬ÏòÈË¿ìËÙ¡¢¼òµ¥´«´ïÐÅÏ¢µÄ¼¼Êõ¡£Í¨¹ýÊý¾Ý¿ÉÊÓ»¯ÄÜ¹»ÓÐÐ§µØÀûÓÃÊý¾Ý£¬°ïÖúÈËÃÇ¸øÖîÈçÒÔÏÂÎÊÌâ¿ìËÙÌá¹©´ð°¸£º
ÐèÒª×¢ÒâµÄÎÊÌâ»ò¸Ä½øµÄ·½Ïò¡£
Ó°Ïì¿Í»§ÐÐÎªµÄÒòËØ¡£
È·¶¨ÉÌÆ··ÅÖÃµÄÎ»ÖÃ¡£
ÏúÁ¿Ô¤²â¡£
   Í¨¹ýÔö¼ÓÊý¾Ý¿ÉÊÓ»¯µÄÊ¹ÓÃ£¬ÄÜ¹»Ê¹ÆóÒµ¸ü¿ìµØ·¢ÏÖËùÒª×·ÇóµÄ¼ÛÖµ¡£´´½¨¸ü¶àµÄÐÅÏ¢Í¼±í£¬ÈÃÈËÃÇ¸ü¿ìµØÊ¹ÓÃ¸ü¶àµÄ×ÊÔ´£¬»ñµÃ¸ü¶àµÄÐÅÏ¢¡£Í¬Ê±Ê¹ÈËÃÇÒâÊ¶µ½ÒÑ¾ÖªµÀºÜ¶àÐÅÏ¢£¬¶øÕâÐ©ÐÅÏ¢ÏÈÇ°¾ÍÓ¦¸ÃÊÇºÜÃ÷ÏÔµÄ£¬´Ó¶øÔö¼ÓÁËÈËÃÇÄÜ¹»Ìá³ö¸üºÃÎÊÌâµÄ¿ÉÄÜ¡£Ëü´´½¨ÁËËÆºõÃ»ÓÐÈÎºÎÁªÏµµÄÊý¾ÝµãÖ®¼äµÄÁ¬½Ó£¬ÈÃÈËÃÇÄÜ¹»·Ö±æ³öÓÐÓÃµÄºÍÃ»ÓÃµÄÊý¾Ý£¬ÕâÑù£¬¾ÍÄÜ×î´óÏÞ¶ÈµÄÌá¸ßÉú²úÁ¦£¬ÈÃÐÅÏ¢µÄ¼ÛÖµ×î´ó»¯¡£

£¨2£©Êý¾Ý¿ÉÊÓ»¯µÄÓÃÍ¾
   ¿ìËÙÀí½âÐÅÏ¢
   Í¨¹ýÊ¹ÓÃÒµÎñÐÅÏ¢µÄÍ¼ÐÎ»¯±íÊ¾£¬ÆóÒµ¿ÉÒÔÒÔÒ»ÖÖÇåÎúµÄ¡¢ÓëÒµÎñÁªÏµ¸ü¼Ó½ôÃÜµÄ·½Ê½²é¿´´óÁ¿µÄÊý¾Ý£¬¸ù¾ÝÕâÐ©ÐÅÏ¢ÖÆ¶¨¾ö²ß¡£²¢ÇÒÓÉÓÚÏà¶ÔÓÚµç×Ó±í¸ñµÄÊý¾Ý·ÖÎö£¬Í¼ÐÎ»¯¸ñÊ½µÄÊý¾Ý·ÖÎöÒª¸ü¿ì£¬Òò´ËÆóÒµ¿ÉÒÔ¸ü¼Ó¼°Ê±µØ·¢ÏÖÎÊÌâ¡¢½â¾öÎÊÌâ¡£
   ±êÊ¶¹ØÏµºÍÄ£Ê½
   ¼´Ê¹Ãæ¶Ô´óÁ¿´í×Û¸´ÔÓµÄÊý¾Ý£¬Í¼ÐÎ»¯±íÊ¾Ò²Ê¹Êý¾Ý±äµÃ¿ÉÒÔÀí½â¡£ÆóÒµÄÜ¹»Ê¶±ð¸ß¶È¹ØÁª¡¢»¥ÏàÓ°ÏìµÄ¶à¸öÒòËØ¡£ÕâÐ©¹ØÏµÓÐÐ©ÊÇÏÔ¶øÒ×¼ûµÄ£¬ÓÐÐ©Ôò²»Ò×·¢ÏÖ¡£Ê¶±ðÕâÐ©¹ØÏµ¿ÉÒÔ°ïÖú×éÖ¯¾Û½¹ÓÚ×îÓÐ¿ÉÄÜÓ°ÏìÆäÖØÒªÄ¿±êµÄÁìÓò¡£
   È·¶¨ÐÂÐËÇ÷ÊÆ
   Ê¹ÓÃÊý¾Ý¿ÉÊÓ»¯£¬¿ÉÒÔ¸¨ÖúÆóÒµ·¢ÏÖÒµÎñ»òÊÐ³¡Ç÷ÊÆ£¬×¼È·¶¨Î»³¬Ô½¾ºÕù¶ÔÊÖµÄ×ÔÉíÓÅÊÆ£¬×îÖÕÓ°ÏìÆä¾ÓªÐ§Òæ¡£ÆóÒµ¸üÈÝÒ×·¢ÏÖÓ°Ïì²úÆ·ÏúÁ¿ºÍ¿Í»§¹ºÂòÐÐÎªµÄÒì³£Êý¾Ý£¬²¢°ÑÐ¡ÎÊÌâÏûÃðÓÚÃÈÑ¿Ö®ÖÐ¡£
   ·½±ã¹µÍ¨½»Á÷
   Ò»µ©´Ó¿ÉÊÓ»¯·ÖÎöÖÐ¶ÔÒµÎñÓÐÁË¸üÐÂµÄÉîÈëÁË½â£¬ÏÂÒ»²½¾ÍÐèÒªÔÚ×éÖ¯¼ä¹µÍ¨ÕâÐ©Çé¿ö¡£Ê¹ÓÃÍ¼±í¡¢Í¼ÐÎ»òÆäËüÓÐÐ§µÄÊý¾Ý¿ÉÊÓ»¯±íÊ¾ÔÚ¹µÍ¨ÖÐÊÇ·Ç³£ÖØÒªµÄ£¬ÒòÎªÕâÖÖ±íÊ¾¸üÄÜÎüÒýÈËµÄ×¢Òâ£¬²¢ÄÜ¿ìËÙ»ñµÃ±Ë´ËµÄÐÅÏ¢¡£

£¨3£©ÊµÊ©Êý¾Ý¿ÉÊÓ»¯ÐèÒª¿¼ÂÇµÄÎÊÌâ
   ÊµÊ©Ò»¸öÐÂ¼¼Êõ£¬ÐèÒª²ÉÈ¡Ò»Ð©²½Öè¡£³ýÁËÔúÊµµØÕÆÎÕÊý¾ÝÍâ£¬»¹ÐèÒªÀí½âÄ¿±ê¡¢ÐèÇóºÍÊÜÖÚ¡£ÔÚ×éÖ¯×¼±¸ÊµÊ©Êý¾Ý¿ÉÊÓ»¯¼¼ÊõÊ±£¬ÏÈÒª×öºÃÒÔÏÂ¹¦¿Î£º
Ã÷È·ÊÔÍ¼¿ÉÊÓ»¯µÄÊý¾Ý£¬°üÀ¨Êý¾ÝÁ¿ºÍ»ùÊý£¨Ò»ÁÐÊý¾ÝÖÐ²»Í¬ÖµµÄ¸öÊý£©¡£
È·¶¨ÐèÒª¿ÉÊÓ»¯ºÍ´«´ïµÄÐÅÏ¢ÖÖÀà¡£
ÁË½âÊý¾ÝµÄÊÜÖÚ£¬²¢Áì»áËûÃÇÈçºÎ´¦Àí¿ÉÊÓ»¯ÐÅÏ¢¡£
Ê¹ÓÃÒ»ÖÖ¶ÔÊÜÖÚÀ´Ëµ×îÓÅ¡¢×î¼òµÄ¿ÉÊÓ»¯·½°¸´«´ïÐÅÏ¢¡£
   ÔÚ¹ØÓÚÊý¾ÝµÄÊôÐÔºÍ×÷ÎªÐÅÏ¢Ïû·ÑÕßµÄÊÜÖÚµÄÏà¹ØÎÊÌâÓÐÁË´ð°¸ºó£¬¾ÍÐèÒª×¼±¸Óë´óÁ¿µÄÊý¾Ý´ò½»µÀÁË¡£´óÊý¾Ý¸ø¿ÉÊÓ»¯´øÀ´ÐÂµÄÌôÕ½£¬4V£¨Volume¡¢Velocity¡¢Variety¡¢Veracity£©ÊÇ±ØÐëÒª¿¼ÂÇµÄÎÊÌâ£¬¶øÇÒÊý¾Ý²úÉúµÄËÙ¶È¾³£»á±ÈÆä±»¹ÜÀíºÍ·ÖÎöµÄËÙ¶È¿ì¡£ÐèÒª¿ÉÊÓ»¯µÄÁÐµÄ»ùÊýÒ²ÊÇÓ¦¸ÃÖØµã¿¼ÂÇµÄÒòËØ£¬¸ß»ùÊýÒâÎ¶×Å¸ÃÁÐÓÐ´óÁ¿²»Í¬Öµ£¨ÈçÒøÐÐÕËºÅµÈ£©£¬¶øµÍ»ùÊýÔòËµÃ÷¸ÃÁÐÓÐ´óÁ¿ÖØ¸´Öµ£¨ÈçÐÔ±ðÁÐ£©¡£

£¨4£©¼¸ÖÖÖ÷ÒªµÄÊý¾Ý¿ÉÊÓ»¯¹¤¾ß
Tableau Desktop£¨Ö÷Á÷×ÀÃæBI£©
Business Object£¨SAPÊÕ¹ºµÄBI¹«Ë¾£©
Hyperion£¨OracleÊÕ¹ºµÄBI¹«Ë¾£©
Cognos£¨IBMÊÕ¹ºµÄBI¹«Ë¾£©
Pentaho Report£¨×îÁ÷ÐÐµÄ¿ªÔ´BI£©
2. Hue¼ò½é
   Ç°ÃæÌÖÂÛÁËÊý¾Ý¿ÉÊÓ»¯£¬ÄÇÃ´ÔÚHadoopÉúÌ¬È¦ÖÐ£¬ÓÐÄÄÐ©Í¼ÐÎ»¯µÄÓÃ»§½çÃæ¿ÉÒÔ×öÊý¾Ý¿ÉÊÓ»¯ÄØ£¿ÕâÀï¾Í¼òµ¥½éÉÜÒ»¸ö³£ÓÃµÄHadoop×é¼þ¡ª¡ªHue¡£
£¨1£©HueÊÇÊ²Ã´
   HueÊÇHadoop User ExperienceµÄËõÐ´£¬ÊÇÒ»¸ö¿ªÔ´µÄApache Hadoop UIÏµÍ³£¬×îÔçÊÇÓÉCloudera DesktopÑÝ»¯¶øÀ´£¬ÓÉCloudera¹±Ï×¸ø¿ªÔ´ÉçÇø£¬ËüÊÇ»ùÓÚPython Web¿ò¼ÜDjangoÊµÏÖµÄ¡£
   ÎÒÊ¹ÓÃµÄCDH 5.7.0×Ô´øµÄHueÊÇ3.9.0°æ±¾¡£Í¨¹ýÊ¹ÓÃCDHµÄHue WebÓ¦ÓÃ£¬¿ÉÒÔÓëHadoop¼¯Èº½øÐÐ½»»¥¡£ÔÚHueÖÐ¿ÉÒÔä¯ÀÀHDFSºÍ×÷Òµ£¬¹ÜÀíHiveÔªÊý¾Ý£¬ÔËÐÐHive¡¢Impala²éÑ¯»òPig½Å±¾£¬ä¯ÀÀHBase£¬ÓÃSqoopµ¼³öÊý¾Ý£¬Ìá½»MapReduce³ÌÐò£¬ÓÃSolr½¨Á¢¶¨ÖÆµÄËÑË÷ÒýÇæ£¬µ÷¶ÈÖØ¸´Ö´ÐÐµÄOozie¹¤×÷Á÷µÈ¡£
   HueÓ¦ÓÃÔËÐÐÔÚWebä¯ÀÀÆ÷ÖÐ£¬²»ÐèÒª°²×°¿Í»§¶Ë¡£ÆäÌåÏµ½á¹¹ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829142422587?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

   Hue ServerÊÇWebÓ¦ÓÃµÄÈÝÆ÷£¬Î»ÓÚCDHºÍä¯ÀÀÆ÷Ö®¼ä£¬ÊÇËùÓÐHue WebÓ¦ÓÃµÄËÞÖ÷£¬¸ºÔðÓëCDH×é¼þÍ¨ÐÅ¡£

£¨2£©Hue¹¦ÄÜ¿ìËÙÔ¤ÀÀ
   ¿ÉÒÔ´ÓCDH ManagerÖÐµÄÁ¬½ÓµÇÂ¼Hue¡£µã»÷¼¯ÈºÖÐµÄHue·þÎñ£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829142507479?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   ÔÚHueÒ³Ãæµã»÷Hue Web UIÁ´½Ó£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829142535877?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   ÕâÊ±»á´ò¿ªµÇÂ¼Ò³Ãæ£¬ÒªÇóÊäÈëÓÃ»§Ãû/ÃÜÂë£¬Ê×´ÎµÇÂ¼ÊäÈëÈÎÒâ×Ö·û´®£¬»á×Ô¶¯×÷Îª¹ÜÀíÔ±µÄÓÃ»§ÃûºÍÃÜÂë£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829142642236?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   µÇÂ¼ºóHue»á½øÐÐÅäÖÃ¼ì²é¡¢°²×°Ê¾Àý¡¢´´½¨»òµ¼ÈëÓÃ»§µÈÏòµ¼²½Öè£¬È»ºó½øÈëHueÖ÷Ò³¡£ÎÒµÄHueÖ÷Ò³ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829142704283?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   Í¼ÖÐ×îÉÏÃæÊÇµ¼º½Ìõ£¬11¸öÍ¼±ê¶¼ÓÐ³¬Á´½Ó¡£HueÍ¼±êÊÇ¡°¹ØÓÚ Hue¡±Á´½Ó£¬µã»÷½øÈë¸ÕµÇÂ¼ºóµÄÏòµ¼²½ÖèÒ³Ãæ¡£µÚ¶þ¸öÊÇÖ÷Ò³Í¼±ê£¬µã»÷½øÈë¡°ÎÒµÄÎÄµµ¡±Ò³Ãæ¡£ºóÃæÒÀ´ÎÎª¡°²éÑ¯Êý¾Ý¡±¡¢¡°¹ÜÀíÊý¾Ý¡±¡¢¡°Ê¹ÓÃ Oozie µÄ¼Æ»®¡±¡¢¡°¹ÜÀíHDFS¡±¡¢¡°¹ÜÀí×÷Òµ¡±¡¢¡°¹ÜÀí¡±¡¢¡°ÎÄµµ¡±¡¢¡°ÑÝÊ¾½Ì³Ì¡±ºÍ¡°×¢Ïú¡±×Ó²Ëµ¥»ò³¬Á´½Ó¡£¡°²éÑ¯Êý¾Ý¡±×Ó²Ëµ¥°üÀ¨Hive¡¢Impala¡¢DB²éÑ¯¡¢PigºÍ×÷ÒµÉè¼ÆÆ÷¡£¡°¹ÜÀíÊý¾Ý¡±×Ó²Ëµ¥°üÀ¨Metastore±íºÍSqoop ´«Êä¡£¡°Ê¹ÓÃ Oozie µÄ¼Æ»®¡±°üÀ¨WorkFlow¡¢Coordinator¡¢BundlesÈýÖÖOozie¹¤×÷Á÷µÄÒÇ±í°åºÍ±à¼Æ÷¡£¡°¹ÜÀí¡±°üÀ¨±à¼ÅäÖÃÎÄ¼þºÍ¹ÜÀíÓÃ»§×Ó²Ëµ¥¡£
   ÕâÐ©ÊÇHueÖ÷ÒªµÄ¹¦ÄÜ£¬Ã¿¸öÖ÷¹¦ÄÜÏÂÃæµÄÏêÏ¸Ò³ÃæÕâÀï¾Í²»Õ¹Ê¾ÁË£¬¶¼ÊÇÒ³Ãæ²Ù×÷£¬¸ÐÐËÈ¤µÄµã»÷ÊÔÒ»ÏÂ±ãÖª¡£ÔÚÕâÐ©¹¦ÄÜÌØÐÔ¼¯ºÏÖÐ£¬¡°²éÑ¯Êý¾Ý¡±ÓëÊý¾Ý¿ÉÊÓ»¯¹ØÏµ×îÎªÃÜÇÐ£¬Ò²ÊÇ×î³£Ê¹ÓÃµÄ¹¦ÄÜ¡£ÔÚºóÃæÊµÀý²¿·Ö£¬½«»á¿´µ½Óë²éÑ¯Ïà¹ØµÄÍ¼ÐÎ»¯±íÊ¾£¬»¹»áÑÝÊ¾ÆäËüÒ»Ð©HueµÄ³£ÓÃ¹¦ÄÜ¡£

£¨3£©ÅäÖÃÔªÊý¾Ý´æ´¢
   ÏñHadoopµÄÆäËü×é¼þÒ»Ñù£¬HueÒ²ÓÐºÜ¶àÅäÖÃÑ¡Ïî£¬Ã¿¸öÑ¡ÏîµÄ¾ßÌåº¬ÒåºÍÅäÖÃËµÃ÷¿ÉÒÔ´ÓCDH ManagerµÄHueÅäÖÃÒ³»òÏà¹ØÎÄµµÖÐÕÒµ½¡£ÔÚÕâÐèÒªËµÃ÷Ò»ÏÂµÄÊÇHue×ÔÉíµÄÔªÊý¾Ý´æ´¢ÅäÖÃ¡£
   Hue·þÎñÆ÷ÐèÒªÒ»¸öSQLÊý¾Ý¿â´æ´¢ÖîÈçÓÃ»§ÕËºÅÐÅÏ¢¡¢Ìá½»µÄ×÷Òµ¡¢Hive²éÑ¯µÈÉÙÁ¿Êý¾Ý¡£CDH 5.7.0È±Ê¡°²×°Ê±£¬HueµÄÔªÊý¾Ý´æ´¢ÔÚÒ»¸öÇ¶ÈëÊ½Êý¾Ý¿âSQLiteÖÐ£¬µ«ÕâÖÖÅäÖÃ²¢²»ÊÊÓÃÓÚÉú²ú»·¾³¡£HueÒ²Ö§³ÖMariaDB¡¢MySQL¡¢PostgreSQL¡¢OracleµÈ¼¸ÖÖÍâ²¿Êý¾Ý¿â¡£ClouderaÇ¿ÁÒÍÆ¼öÔÚHue¶àÓÃ»§»·¾³£¬ÌØ±ðÊÇÉú²ú»·¾³ÖÐÊ¹ÓÃÍâ²¿Êý¾Ý¿â¡£CDH 5ËùÖ§³ÖµÄÊý¾Ý¿âÍêÕûÁÐ±íÁ´½ÓÔÚhttp://www.cloudera.com/document ... rsions.html#topic_2¡£
   ÏÂÃæËµÃ÷Ê¹ÓÃCDH ManagerÅäÖÃHue·þÎñÆ÷ÔÚMySQLÖÐ´æ´¢ÔªÊý¾ÝµÄÏêÏ¸²½Öè£¨×¢Òâ£ºClouderaÍÆ¼öÊ¹ÓÃInnoDB×÷ÎªHueµÄMySQL´æ´¢ÒýÇæ¡£CDH 5µÄHueÐèÒªInnoDB£©¡£

      ÅäÖÃÇ°ÐèÇó£º
°²×°ËùÓÃ²Ù×÷ÏµÍ³ÐèÒªµÄËùÓÐÀà¿â¡£ÈçCentOS/RHELÐèÒªµÄÀà¿âÈçÏÂ£º
         Oracle's JDK (read more here)
         ant
         asciidoc
         cyrus-sasl-devel
         cyrus-sasl-gssapi
         cyrus-sasl-plain
         gcc
         gcc-c++
         krb5-devel
         libffi-devel
         libtidy (for unit tests only)
         libxml2-devel
         libxslt-devel
         make
         mvn (from apache-maven package or maven3 tarball)
         mysql
         mysql-devel
         openldap-devel
         python-devel
         sqlite-devel
         openssl-devel (for version 7+)
         gmp-devel
         ¸÷²Ù×÷ÏµÍ³ÐèÒªµÄÀà¿âÍêÕûÁÐ±íÁ´½ÓÔÚhttps://github.com/cloudera/hue#development-prerequisites¡£
È·ÈÏHue ServerÔËÐÐÔÚPython 2.6»òÒÔÉÏ°æ±¾ÉÏ¡£
°²×°ÁËMySQLÊý¾Ý¿â£¨MySQLÊý¾Ý¿âµÄ°²×°ÅäÖÃÏê¼ûhttp://www.cloudera.com/document ... html#cmig_topic_5_5£©¡£
ÔÚCloudera Manager¹ÜÀí¿ØÖÆÌ¨ÖÐ£¬´Ó·þÎñÁÐ±íÖÐµã»÷¡°Hue¡±½øÈëHue·þÎñ×´Ì¬Ò³Ãæ¡£
Ñ¡Ôñ¡°²Ù×÷¡± > ¡°Í£Ö¹¡±£¬Í£Ö¹Hue·þÎñ£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829143520085?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
Ñ¡Ôñ¡°²Ù×÷¡± > ¡°×ª´¢Êý¾Ý¿â¡±£¬½«ÔªÊý¾Ý¿â×ª´¢ÎªÒ»¸öjsonÎÄ¼þÖÐ¡£
×¢ÒâÔÚ¡°×ª´¢Êý¾Ý¿â¡±ÃüÁîÖ´ÐÐ´°¿ÚÖÐ£¬È·ÈÏ×ª´¢ÎÄ¼þËùÔÚµÄÖ÷»ú£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829143551414?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

ÔÚ¸ÃÖ÷»úÉÏ´ò¿ªÒ»¸öÖÕ¶Ë´°¿Ú£¬±à¼/tmp/hue_database_dump.jsonÎÄ¼þ£¬È¥µôÎÄ¼þÖÐuseradmin.userprofile¶ÎÖÐµÄËùÓÐJSON¶ÔÏó£¬ÀýÈç£º
{
"pk": 14,
"model": "useradmin.userprofile",
"fields":
{ "creation_method": "EXTERNAL", "user": 14, "home_directory": "/user/tuser2" }
},
ÔÚ/etc/my.cnfÎÄ¼þÖÐÉèÖÃMySQLÑÏ¸ñÄ£Ê½¡£

sql_mode=STRICT_ALL_TABLES
ÔÚMySQLÖÐ½¨Á¢Ò»¸öÐÂµÄÊý¾Ý¿â²¢ÊÚÓèÒ»¸öHueÓÃ»§¸Ã¿âµÄ¹ÜÀíÔ±È¨ÏÞ£¬ÀýÈç£º
mysql> create database hue;
Query OK, 1 row affected (0.01 sec)
mysql> grant all on hue.* to 'hue'@'localhost' identified by 'secretpassword';
Query OK, 0 rows affected (0.00 sec)
ÔÚCloudera Manager¹ÜÀí¿ØÖÆÌ¨£¬µã»÷¡°Hue¡±·þÎñ¡£
µã»÷¡°ÅäÖÃ¡±±êÇ©¡£
¡°Àà±ð¡±Ñ¡Ôñ¡°Êý¾Ý¿â¡±¡£
Ö¸¶¨HueÊý¾Ý¿âµÄÀàÐÍ¡¢Ö÷»úÃû¡¢¶Ë¿Ú¡¢ÓÃ»§Ãû¡¢ÃÜÂëºÍÊý¾Ý¿âÃû¡£ÀýÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160829144000650?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
ÔÚÐÂÊý¾Ý¿â»¹ÔHueµÄÔªÊý¾Ý¡£
         a. Ñ¡Ôñ¡°²Ù×÷¡± > ¡°Í¬²½Êý¾Ý¿â¡±¡£
         b. È·ÈÏÍâ¼ü£¬ÈçÏÂÍ¼ËùÊ¾¡£
$ mysql -uhue -psecretpassword
mysql > SHOW CREATE TABLE auth_permission\G
mysql > SHOW CREATE TABLE desktop_document\G
mysql > SHOW CREATE TABLE django_admin_log\G

https://img-blog.csdn.net/20160829144214182?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
         c. É¾³ýÉÏÒ»²½²é³öµÄÍâ¼ü¡£

mysql > ALTER TABLE auth_permission DROP FOREIGN KEY content_type_id_refs_id_d043b34a;
mysql > ALTER TABLE desktop_document DROP FOREIGN KEY content_type_id_refs_id_800664c4;
mysql > ALTER TABLE django_admin_log DROP FOREIGN KEY content_type_id_refs_id_93d2d1f8;
         d. É¾³ýdjango_content_type±íÀïµÄÊý¾Ý¡£
DELETE FROM hue.django_content_type;
         e. ÔÚHue·þÎñÒ³£¬µã»÷¡°²Ù×÷¡± > ¡°¼ÓÔØÊý¾Ý¿â¡±¡£
         f. Ìí¼Óc²½É¾³ýµÄÍâ¼ü¡£
mysql > ALTER TABLE auth_permission ADD FOREIGN KEY (content_type_id) REFERENCES django_content_type (id);
mysql > ALTER TABLE desktop_document ADD FOREIGN KEY (content_type_id) REFERENCES django_content_type (id);
mysql > ALTER TABLE django_admin_log ADD FOREIGN KEY (content_type_id) REFERENCES django_content_type (id);
   13. Æô¶¯Hue·þÎñ¡£
   Èç¹ûÔÚÉÏÊö²½ÖèÖÐ±¨ÀàËÆ¡°libmysqlclient.so.16: cannot open shared object file: No such file or directory¡±ÕâÖÖ´íÎó£¬ËµÃ÷MySQLµÄÀà¿âºÍHueËùÐèµÄ²»¼æÈÝ£¬ÕâÊ±Ö»ÐèÏÂÔØ¼æÈÝ°æ±¾µÄ¿âÎÄ¼þ£¬²¢·ÅÖÃµ½/usr/lib64Ä¿Â¼£¬ÔÙ²Ù×÷¾Í²»»á±¨´íÁË¡£

Îå¡¢Hue¡¢Zeppelin±È½Ï
   ÉÏÒ»½Ú¼òµ¥½éÉÜÁËHueÕâÖÖHadoopÉúÌ¬È¦µÄÊý¾Ý¿ÉÊÓ»¯×é¼þ£¬±¾½ÚÌÖÂÛÁíÒ»ÖÖÀàËÆµÄ²úÆ·¡ª¡ªZeppelin¡£Ê×ÏÈ½éÉÜÒ»ÏÂZeppelin£¬È»ºóËµÃ÷Æä°²×°µÄÏêÏ¸²½Öè£¬Ö®ºóÑÝÊ¾ÈçºÎÔÚZeppelinÖÐÌí¼ÓMySQL·ÒëÆ÷£¬×îºó´Ó¹¦ÄÜ¡¢¼Ü¹¹¡¢Ê¹ÓÃ³¡¾°¼¸·½Ãæ½«HueºÍZeppelin×öÒ»¸ö±È½Ï¡£
1. Zeppelin¼ò½é
   ZeppelinÊÇÒ»¸ö»ùÓÚWebµÄÈí¼þ£¬ÓÃÓÚ½»»¥Ê½µØÊý¾Ý·ÖÎö¡£Ò»¿ªÊ¼ÊÇApacheÈí¼þ»ù½ð»áµÄ·õ»¯ÏîÄ¿£¬2016Äê5ÔÂÕýÊ½³ÉÎªÒ»¸ö¶¥¼¶ÏîÄ¿£¨Top-Level Project£¬TLP£©¡£ZeppelinÃèÊö×Ô¼ºÊÇÒ»¸ö¿ÉÒÔ½øÐÐÊý¾ÝÉãÈ¡¡¢Êý¾Ý·¢ÏÖ¡¢Êý¾Ý·ÖÎö¡¢Êý¾Ý¿ÉÊÓ»¯µÄ±Ê¼Ç±¾£¬ÓÃÒÔ°ïÖú¿ª·¢Õß¡¢Êý¾Ý¿ÆÑ§¼ÒÒÔ¼°Ïà¹ØÓÃ»§¸üÓÐÐ§µØ´¦ÀíÊý¾Ý£¬¶ø²»±ØÊ¹ÓÃ¸´ÔÓµÄÃüÁîÐÐ£¬Ò²²»±Ø¹ØÐÄ¼¯ÈºµÄÊµÏÖÏ¸½Ú¡£ZeppelinµÄ¼Ü¹¹Í¼ÈçÏÂËùÊ¾¡£

https://img-blog.csdn.net/20160830155525589?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
´ÓÍ¼ÖÐ¿ÉÒÔ¿´µ½£¬Zeppelin¾ßÓÐ¿Í»§¶Ë/·þÎñÆ÷¼Ü¹¹£¬¿Í»§¶ËÒ»°ã¾ÍÊÇÖ¸ä¯ÀÀÆ÷¡£·þÎñÆ÷½ÓÊÕ¿Í»§¶ËµÄÇëÇó£¬²¢½«ÇëÇóÍ¨¹ýThriftÐÒé·¢ËÍ¸ø·ÒëÆ÷×é¡£·ÒëÆ÷×éÎïÀí±íÏÖÎªJVM½ø³Ì£¬¸ºÔðÊµ¼Ê´¦Àí¿Í»§¶ËµÄÇëÇó²¢Óë·þÎñÆ÷½øÐÐÍ¨ÐÅ¡£
   ·ÒëÆ÷ÊÇÒ»¸ö²å¼þÊ½µÄÌåÏµ½á¹¹£¬ÔÊÐíÈÎºÎÓïÑÔ/ºó¶ËÊý¾Ý´¦Àí³ÌÐòÒÔ²å¼þµÄÐÎÊ½Ìí¼Óµ½ZeppelinÖÐ¡£ÌØ±ðÐèÒªÖ¸³öµÄÊÇ£¬ZeppelinÄÚ½¨Spark·ÒëÆ÷£¬Òò´Ë²»ÐèÒª¹¹½¨µ¥¶ÀµÄÄ£¿é¡¢²å¼þ»ò¿â¡£Spark·ÒëÆ÷µÄ¼Ü¹¹Í¼ÈçÏÂËùÊ¾¡£
https://img-blog.csdn.net/20160830155708217?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
µ±Ç°µÄZeppelinÒÑ¾Ö§³ÖºÜ¶à·ÒëÆ÷£¬ÈçZeppelin 0.6.0°æ±¾×Ô´øµÄ·ÒëÆ÷ÓÐalluxio¡¢cassandra¡¢file¡¢hbase¡¢ignite¡¢kylin¡¢md¡¢phoenix¡¢sh¡¢tajo¡¢angular¡¢elasticsearch¡¢flink¡¢hive¡¢jdbc¡¢lens¡¢psql¡¢sparkµÈ18ÖÖÖ®¶à¡£²å¼þÊ½¼Ü¹¹ÔÊÐíÓÃ»§ÔÚZeppelinÖÐÊ¹ÓÃ×Ô¼ºÊìÏ¤µÄÌØ¶¨³ÌÐòÓïÑÔ»òÊý¾Ý´¦Àí·½Ê½¡£ÀýÈç£¬Í¨¹ýÊ¹ÓÃ%spark·ÒëÆ÷£¬¿ÉÒÔÔÚZeppelinÖÐÊ¹ÓÃScalaÓïÑÔ´úÂë¡£
   ÔÚÊý¾Ý¿ÉÊÓ»¯·½Ãæ£¬ZeppelinÒÑ¾°üº¬Ò»Ð©»ù±¾µÄÍ¼±í£¬ÈçÖù×´Í¼¡¢±ýÍ¼¡¢ÏßÐÎÍ¼¡¢É¢µãÍ¼µÈ£¬ÈÎºÎºó¶ËÓïÑÔµÄÊä³ö¶¼¿ÉÒÔ±»Í¼ÐÎ»¯±íÊ¾¡£
   ÓÃ»§½¨Á¢µÄÃ¿Ò»¸ö²éÑ¯½Ð×öÒ»¸önote£¬noteµÄURLÔÚ¶àÓÃ»§¼ä¹²Ïí£¬Zeppelin½«ÏòËùÓÐÓÃ»§ÊµÊ±¹ã²¥noteµÄ±ä»¯¡£Zeppelin»¹Ìá¹©Ò»¸öÖ»ÏÔÊ¾²éÑ¯½á¹ûµÄURL£¬¸ÃÒ³²»°üÀ¨ÈÎºÎ²Ëµ¥ºÍ°´Å¥¡£ÓÃÕâÖÖ·½Ê½¿ÉÒÔ·½±ãµØ½«½á¹ûÒ³×÷ÎªÒ»Ö¡Ç¶Èëµ½×Ô¼ºµÄwebÕ¾µãÖÐ¡£

2. Zeppelin°²×°ÅäÖÃ
   ÏÂÃæÓÃÒ»¸öµäÐÍµÄÊ¹ÓÃ³¡¾°¡ª¡ªÊ¹ÓÃZeppelinÔËÐÐSparkSQL·ÃÎÊHive±í£¬ÔÚÒ»¸öÊµÑé»·¾³ÉÏËµÃ÷ZeppelinµÄ°²×°ÅäÖÃ²½Öè¡£
£¨1£©°²×°»·¾³
   12¸ö½ÚµãµÄSpark¼¯Èº£¬ÒÔstandalone·½Ê½²¿Êð£¬¸÷¸ö½ÚµãÔËÐÐµÄ½ø³ÌÈçÏÂ±íËùÊ¾¡£
Ö÷»úÃû

ÔËÐÐ½ø³Ì

nbidc-agent-03

NameNode¡¢Spark Master

nbidc-agent-04

SecondaryNameNode

nbidc-agent-11

ResourceManager¡¢DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-12

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-13

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-14

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-15

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-18

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-19

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-20

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-21

DataNode¡¢NodeManager¡¢Spark Worker

nbidc-agent-22

DataNode¡¢NodeManager¡¢Spark Worker

   ²Ù×÷ÏµÍ³£ºCentOS release 6.4
   Hadoop°æ±¾£º2.7.0
   Hive°æ±¾£º2.0.0
   Spark°æ±¾£º1.6.0

£¨2£©ÔÚnbidc-agent-04ÉÏ°²×°²¿ÊðZeppelin¼°ÆäÏà¹Ø×é¼þ
   Ç°Ìá£ºnbidc-agent-04ÐèÒªÄÜ¹»Á¬½Ó»¥ÁªÍø¡£
°²×°Git£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
yum install curl-devel expat-devel gettext-devel openssl-devel zlib-devel
yum install gcc perl-ExtUtils-MakeMaker
yum remove git
cd /home/work/tools/
wget https://github.com/git/git/archive/v2.8.1.tar.gz
tar -zxvf git-2.8.1.tar.gz
cd git-2.8.1.tar.gz
make prefix=/home/work/tools/git all
make prefix=/home/work/tools/git install
°²×°Java£ºÔÚnbidc-agent-03»úÆ÷ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¿½±´Java°²×°Ä¿Â¼µ½nbidc-agent-04»úÆ÷ÉÏ¡£

scp -r jdk1.7.0_75 nbidc-agent-04:/home/work/tools/

°²×°Apache Maven£ºÔÚagent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cd /home/work/tools/
wget ftp://mirror.reverse.net/pub/apa ... en-3.3.9-bin.tar.gz
tar -zxvf apache-maven-3.3.9-bin.tar.gz
°²×°Hadoop¿Í»§¶Ë£ºÔÚnbidc-agent-03»úÆ÷ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¿½±´Hadoop°²×°Ä¿Â¼µ½nbidc-agent-04»úÆ÷ÉÏ¡£
scp -r hadoop nbidc-agent-04:/home/work/tools/
°²×°Spark¿Í»§¶Ë£ºÔÚnbidc-agent-03»úÆ÷ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¿½±´Spark°²×°Ä¿Â¼µ½nbidc-agent-04»úÆ÷ÉÏ¡£
scp -r spark nbidc-agent-04:/home/work/tools/
°²×°Hive¿Í»§¶Ë£ºÔÚnbidc-agent-03»úÆ÷ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¿½±´Hive°²×°Ä¿Â¼µ½nbidc-agent-04»úÆ÷ÉÏ¡£
scp -r hive nbidc-agent-04:/home/work/tools/
°²×°phantomjs£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cd /home/work/tools/
tar -jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2
ÏÂÔØ×îÐÂµÄzeppelinÔ´Âë£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cd /home/work/tools/
git clone https://github.com/apache/incubator-zeppelin.git
ÉèÖÃ»·¾³±äÁ¿£ºÔÚnbidc-agent-04ÉÏ±à¼/home/work/.bashrcÎÄ¼þ£¬ÄÚÈÝÈçÏÂ¡£
vi /home/work/.bashrc
# Ìí¼ÓÏÂÃæµÄÄÚÈÝ
export PATH=.:$PATH:/home/work/tools/jdk1.7.0_75/bin:/home/work/tools/hadoop/bin:/home/work/tools/spark/bin:/home/work/tools/hive/bin:/home/work/tools/phantomjs-2.1.1-linux-x86_64/bin:/home/work/tools/incubator-zeppelin/bin;
export JAVA_HOME=/home/work/tools/jdk1.7.0_75
export HADOOP_HOME=/home/work/tools/hadoop
export SPARK_HOME=/home/work/tools/spark
export HIVE_HOME=/home/work/tools/hive
export ZEPPELIN_HOME=/home/work/tools/incubator-zeppelin
# ±£´æÎÄ¼þ£¬²¢ÊÇÉèÖÃÉúÐ§
source /home/work/.bashrc
±àÒëzeppelinÔ´Âë£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cd /home/work/tools/incubator-zeppelin
mvn clean package -Pspark-1.6 -Dspark.version=1.6.0 -Dhadoop.version=2.7.0 -Phadoop-2.6 -Pyarn -DskipTests
£¨3£©ÅäÖÃzeppelin

[*]ÅäÖÃzeppelin-env.shÎÄ¼þ£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cp /home/work/tools/incubator-zeppelin/conf/zeppelin-env.sh.template/home/work/tools/incubator-zeppelin/conf/zeppelin-env.sh
vi /home/work/tools/incubator-zeppelin/conf/zeppelin-env.sh
# Ìí¼ÓÏÂÃæµÄÄÚÈÝ
export JAVA_HOME=/home/work/tools/jdk1.7.0_75
export HADOOP_CONF_DIR=/home/work/tools/hadoop/etc/hadoop
export MASTER=spark://nbidc-agent-03:7077

ÅäÖÃzeppelin-site.xmlÎÄ¼þ£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£

cp /home/work/tools/incubator-zeppelin/conf/zeppelin-site.xml.template/home/work/tools/incubator-zeppelin/conf/zeppelin-site.xml
vi /home/work/tools/incubator-zeppelin/conf/zeppelin-site.xml
# ÐÞ¸ÄÏÂÃæÕâ¶ÎµÄvalueÖµ£¬ÉèÖÃzeppelinµÄ¶Ë¿ÚÎª9090
<property>
<name>zeppelin.server.port</name>
<value>9090</value>
<description>Server port.</description>
</property>

½«hive-site.xml¿½±´µ½zeppelinµÄÅäÖÃÄ¿Â¼ÏÂ£ºÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
cd /home/work/tools/incubator-zeppelincp /home/work/tools/hive/conf/hive-site.xml .

£¨4£©Æô¶¯zeppelin
   ÔÚnbidc-agent-04ÉÏÖ´ÐÐÏÂÃæµÄÖ¸Áî¡£
zeppelin-daemon.sh start£¨5£©²âÊÔ
   ´Óä¯ÀÀÆ÷ÊäÈëhttp://nbidc-agent-04:9090/£¬ÈçÏÂÍ¼ËùÊ¾¡£https://img-blog.csdn.net/20160830160649700?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
µã»÷¡®Interpreter¡¯²Ëµ¥£¬ÅäÖÃ²¢±£´æspark½âÊÍÆ÷£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160830160713529?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

ÅäÖÃ²¢±£´æhive½âÊÍÆ÷£¬ÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830160736779?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
µã»÷¡®NoteBook¡¯->¡®Create new note¡¯×Ó²Ëµ¥Ïî£¬½¨Á¢Ò»¸öÐÂµÄ²éÑ¯²¢Ö´ÐÐ£¬½á¹ûÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830161011483?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

ËµÃ÷£ºÕâÊÇÒ»¸ö¶¯Ì¬±íµ¥SQL£¬SparkSQLÓï¾äÎª£º
%sql
select * from wxy.t1 where rate > ${r}
µÚÒ»ÐÐÖ¸¶¨½âÊÍÆ÷ÎªSparkSQL£¬µÚ¶þÐÐÓÃ${r}Ö¸¶¨Ò»¸öÔËÐÐÊ±²ÎÊý£¬Ö´ÐÐÊ±Ò³ÃæÉÏ»á³öÏÖÒ»¸öÎÄ±¾±à¼¿ò£¬ÊäÈë²ÎÊýºó»Ø³µ£¬²éÑ¯»á°´ÕÕÖ¸¶¨²ÎÊý½øÐÐ£¬ÈçÍ¼»á²éÑ¯rate > 100µÄ¼ÇÂ¼¡£

3. ÔÚZeppelinÖÐÌí¼ÓMySQL·ÒëÆ÷
   Êý¾Ý¿ÉÊÓ»¯µÄÐèÇóºÜÆÕ±é£¬Èç¹û³£ÓÃµÄÈçMySQLÕâÑùµÄ¹ØÏµÊý¾Ý¿âÒ²ÄÜÊ¹ÓÃZeppelin²éÑ¯£¬²¢½«½á¹ûÍ¼ÐÎ»¯ÏÔÊ¾£¬ÄÇÃ´¾Í¿ÉÒÔÓÃÒ»Ì×Í³Ò»µÄÊý¾Ý¿ÉÊÓ»¯·½°¸´¦Àí´ó¶àÊý³£ÓÃ²éÑ¯¡£Zeppelin±¾Éí»¹²»´øMySQL·ÒëÆ÷£¬ÐÒÔËµÄÊÇÒÑ¾ÓÐMySQL·ÒëÆ÷²å¼þÁË¡£ÏÂÃæËµÃ÷¸Ã²å¼þµÄ°²×°²½Öè¼°¼òµ¥²âÊÔ¡£
£¨1£©±àÒëMySQL InterpreterÔ´´úÂë
cd /home/work/tools/
git clone https://github.com/jiekechoo/zeppelin-interpreter-mysql
mvn clean package
£¨2£©²¿Êð¶þ½øÖÆ°ü

mkdir /home/work/tools/incubator-zeppelin/interpreter/mysql
cp /home/work/tools/zeppelin-interpreter-mysql/target/zeppelin-mysql-0.5.0-incubating.jar /home/work/tools/incubator-zeppelin/interpreter/mysql/
# copy dependencies to mysql directory
cp commons-exec-1.1.jar mysql-connector-java-5.1.6.jar slf4j-log4j12-1.7.10.jar log4j-1.2.17.jar slf4j-api-1.7.10.jar /home/work/tools/incubator-zeppelin/interpreter/mysql/
vi /home/work/tools/incubator-zeppelin/conf/zeppelin-site.xml

ÔÚzeppelin.interpreters µÄvalueÀïÔö¼ÓÒ»Ð©ÄÚÈÝ¡°,org.apache.zeppelin.mysql.MysqlInterpreter¡±£¬ÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830161210144?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

£¨3£©ÖØÆôZeppelin
zeppelin-daemon.sh restart£¨4£©¼ÓÔØMySQL Interpreter
´ò¿ªÖ÷Ò³http://nbidc-agent-04:9090/£¬¡®Interpreter¡¯ -> ¡®Create¡¯£¬Íê³ÉÀàËÆÏÂÍ¼µÄÒ³Ãæ£¬Íê³Éµã»÷¡®Save¡¯https://img-blog.csdn.net/20160830161303161?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

£¨5£©²âÊÔ

[*]´´½¨ÃûÎªmysql_testµÄnote£¬ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160830162005467?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

[*]ÊäÈëÏÂÃæµÄ²éÑ¯Óï¾ä£¬°´´´½¨ÈÕÆÚÍ³¼Æ½¨Á¢±íµÄ¸öÊý¡£
%mysql
select date_format(create_time,'%Y-%m-%d') d, count(*) c
from information_schema.tables
group by date_format(create_time,'%Y-%m-%d')
order by d;

²éÑ¯½á¹ûµÄ±í¸ñ±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830162059984?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
²éÑ¯½á¹ûµÄÖù×´Í¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160830162137081?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

²éÑ¯½á¹ûµÄ±ýÍ¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160830162159032?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

²éÑ¯½á¹ûµÄ¶ÑµþÍ¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830162248378?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

²éÑ¯½á¹ûµÄÏßÐÎÍ¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£
https://img-blog.csdn.net/20160830162428301?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

²éÑ¯½á¹ûµÄÉ¢µãÍ¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£

https://img-blog.csdn.net/20160830162452254?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   ±¨±íÄ£Ê½µÄ±ýÍ¼±íÊ¾ÈçÏÂÍ¼ËùÊ¾¡£https://img-blog.csdn.net/20160830162513020?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
   ¿ÉÒÔµã»÷ÈçÏÂÍ¼ËùÊ¾µÄÁ´½Óµ¥¶ÀÒýÓÃ´Ë±¨±í
https://img-blog.csdn.net/20160830162534051?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

   µ¥¶ÀµÄÒ³ÃæÄÜ¸ù¾Ý²éÑ¯µÄÐÞ¸Ä¶øÊµÊ±±ä»¯£¬±ÈÈç½«²éÑ¯ÐÞ¸ÄÎª£ºselect date_format(create_time,'%Y-%m-%d') d, count(*) c
from information_schema.tables
where create_time > '2016-06-07'
group by date_format(create_time,'%Y-%m-%d')
order by d;

Ôö¼ÓÁËwhere×Ó¾ä£¬ÔÚÔËÐÐ´Ë²éÑ¯£¬½á¹ûÈçÏÂÍ¼ËùÊ¾¡£
   µ¥¶ÀÁ´½ÓµÄÒ³ÃæÒ²ËæÖ®×Ô¶¯·¢Éú±ä»¯£¬ÈçÏÂÍ¼ËùÊ¾¡£

5. HueÓëZeppelin±È½Ï£¨1£©¹¦ÄÜZeppelinºÍHue¶¼ÄÜÌá¹©Ò»¶¨µÄÊý¾Ý¿ÉÊÓ»¯µÄ¹¦ÄÜ£¬¶¼Ìá¹©ÁË¶àÖÖÍ¼ÐÎ»¯Êý¾Ý±íÊ¾ÐÎÊ½¡£µ¥´ÓÕâµãÀ´Ëµ£¬¸öÈËÈÏÎª¹¦ÄÜÀàËÆ£¬´óÍ¬Ð¡Òì£¬Hue¿ÉÒÔÍ¨¹ý¾Î³¶È½øÐÐµØÍ¼¶¨Î»£¬Õâ¸ö¹¦ÄÜÎÒÔÚZeppelin 0.6.0ÉÏÃ»ÓÐÕÒµ½¡£ZeppelinÖ§³ÖµÄºó¶ËÊý¾Ý²éÑ¯³ÌÐò½Ï¶à£¬0.6.0°æ±¾È±Ê¡ÓÐ18ÖÖ£¬ÔÉúÖ§³ÖSpark¡£¶øHueµÄ3.9.0°æ±¾È±Ê¡Ö»Ö§³ÖHive¡¢Impala¡¢PigºÍÊý¾Ý¿â²éÑ¯¡£ZeppelinÖ»Ìá¹©ÁËµ¥Ò»µÄÊý¾Ý´¦Àí¹¦ÄÜ£¬°üÀ¨Ç°ÃæÌáµ½µÄÊý¾ÝÉãÈ¡¡¢Êý¾Ý·¢ÏÖ¡¢Êý¾Ý·ÖÎö¡¢Êý¾Ý¿ÉÊÓ»¯µÈ¶¼ÊôÓÚÊý¾Ý´¦ÀíµÄ·¶³ë¡£¶øHueµÄ¹¦ÄÜÏà¶Ô·á¸»µÄ¶à£¬³ýÁËÀàËÆµÄÊý¾Ý´¦Àí£¬»¹ÓÐÔªÊý¾Ý¹ÜÀí¡¢Oozie¹¤×÷Á÷¹ÜÀí¡¢×÷Òµ¹ÜÀí¡¢ÓÃ»§¹ÜÀí¡¢Sqoop¼¯³ÉµÈºÜ¶à¹ÜÀí¹¦ÄÜ¡£´ÓÕâµã¿´£¬ZeppelinÖ»ÊÇÒ»¸öÊý¾Ý´¦Àí¹¤¾ß£¬¶øHue¸üÏñÊÇÒ»¸ö×ÛºÏ¹ÜÀí¹¤¾ß¡££¨2£©¼Ü¹¹Zeppelin²ÉÓÃ²å¼þÊ½µÄ·ÒëÆ÷£¬Í¨¹ý²å¼þ¿ª·¢£¬¿ÉÒÔÌí¼ÓÈÎºÎºó¶ËÓïÑÔºÍÊý¾Ý´¦Àí³ÌÐò¡£Ïà¶ÔÀ´Ëµ¸ü¶ÀÁ¢ºÍ¿ª·Å¡£HueÓëHadoopÉúÌ¬È¦µÄÆäËü×é¼þÃÜÇÐÏà¹Ø£¬Ò»°ã¶¼ÓëCDHÒ»Í¬²¿Êð¡££¨3£©Ê¹ÓÃ³¡¾°ZeppelinÊÊºÏµ¥Ò»Êý¾Ý´¦Àí¡¢µ«ºó¶Ë´¦ÀíÓïÑÔ·±¶àµÄ³¡¾°£¬ÓÈÆäÊÊºÏSpark¡£HueÊÊºÏÓëHadoop¼¯ÈºµÄ¶à¸ö×é¼þ½»»¥¡¢ÈçOozie¹¤×÷Á÷¡¢SqoopµÈÁªºÏ´¦ÀíÊý¾ÝµÄ³¡¾°£¬ÓÈÆäÊÊºÏÓëImpalaÐÍ¬¹¤×÷¡£
https://img-blog.csdn.net/20160902143006714?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center
Áù¡¢HueÊý¾Ý¿ÉÊÓ»¯ÊµÀý    ±¾½ÚÏÈÓÃImpala¡¢DB²éÑ¯Ê¾ÀýËµÃ÷HueµÄÊý¾Ý²éÑ¯ºÍ¿ÉÊÓ»¯¹¦ÄÜ£¬È»ºó½»»¥Ê½µØ½¨Á¢Ò»¸ö¶¨ÆÚÖ´ÐÐÏúÊÛ¶©µ¥Ê¾ÀýETLÈÎÎñµÄ¹¤×÷Á÷£¬ËµÃ÷ÔÚHueÀïÊÇÈçºÎ²Ù×÷Oozie¹¤×÷Á÷ÒýÇæµÄ¡£1. Impala²éÑ¯    ÔÚImpala OLAPÊµÀýÒ»½ÚÖÐÖ´ÐÐÁËÒ»Ð©²éÑ¯£¬ÏÖÔÚÔÚHueÀïÖ´ÐÐ²éÑ¯£¬Ö±¹Û¿´Ò»ÏÂ½á¹ûµÄÍ¼ÐÎ»¯±íÊ¾Ð§¹û¡££¨1£©µÇÂ¼Hue£¬µã»÷Í¼±ê½øÈë¡°ÎÒµÄÎÄµµ¡±Ò³Ãæ¡££¨2£©µã»÷´´½¨Ò»¸öÃûÎª¡°ÏúÊÛ¶©µ¥¡±µÄÐÂÏîÄ¿¡££¨3£©µã»÷½øÈëImpala²éÑ¯±à¼Ò³Ãæ£¬´´½¨Ò»¸öÐÂµÄImpalaÎÄµµ¡££¨4£©ÔÚImpala²éÑ¯±à¼Ò³Ãæ£¬Ñ¡Ôñolap¿â£¬È»ºóÔÚ±à¼´°¿ÚÊäÈëÏÂÃæµÄ²éÑ¯Óï¾ä¡£-- °´²úÆ··ÖÀà²éÑ¯ÏúÊÛÁ¿ºÍÏúÊÛ¶îselect t2.product_category pro_category,    sum(order_quantity) sum_quantity,    sum(order_amount) sum_amount from sales_order_fact t1, product_dim t2 where t1.product_sk = t2.product_sk group by pro_category order by pro_category;
-- °´²úÆ·²éÑ¯ÏúÊÛÁ¿ºÍÏúÊÛ¶îselect t2.product_name pro_name,    sum(order_quantity) sum_quantity,    sum(order_amount) sum_amount from sales_order_fact t1, product_dim t2 where t1.product_sk = t2.product_sk group by pro_name order by pro_name;    µã»÷¡°Ö´ÐÐ¡±°´Å¥£¬½á¹ûÏÔÊ¾°´²úÆ··ÖÀàµÄÏúÊÛÍ³¼Æ£¬ÈçÏÂÍ¼ËùÊ¾¡£½Ó×Åµã»÷¡°ÏÂÒ»Ò³¡±°´Å¥£¬½á¹û»áÏÔÊ¾°´²úÆ·µÄÏúÊÛÍ³¼Æ¡£

£¨5£©µã»÷¡°È«ÆÁ²é¿´½á¹û¡±°´Å¥£¬»áÈ«ÆÁÏÔÊ¾²éÑ¯½á¹û¡£    ²úÆ·Í³¼Æ½á¹ûÈçÏÂÍ¼ËùÊ¾¡£

   ²úÆ·Í³¼ÆÖù×´Í¼ÈçÏÂÍ¼ËùÊ¾¡£
   ´ÓÍ¼ÖÐ¿ÉÒÔ¿´µ½£¬°´ÏúÊÛ¶î´Ó´óµ½Ð¡ÅÅÐòµÄ²úÆ·ÒÀ´ÎÎªHard Disk Drive¡¢Floppy Drive¡¢Flat Panel¡¢KeyboardºÍLCD Panel¡£
£¨6£©»Øµ½²éÑ¯±à¼Ò³£¬µã»÷¡°Áí´æÎª...¡±°´Å¥£¬±£´æ³ÉÃûÎª¡°°´²úÆ·Í³¼Æ¡±µÄ²éÑ¯¡££¨7£©µã»÷¡°ÐÂ²éÑ¯¡±°´Å¥£¬°´Í¬ÑùµÄ·½·¨ÔÙ½¨Á¢Ò»¸ö¡°°´µØÇøÍ³¼Æ¡±µÄ²éÑ¯¡£SQLÓï¾äÈçÏÂ£º-- °´ÖÝ²éÑ¯ÏúÊÛÁ¿ºÍÏúÊÛ¶îselect t3.state state,    count(distinct t2.customer_sk) sum_customer_num,    sum(order_amount) sum_order_amount from sales_order_fact t1 inner join customer_dim t2 on t1.customer_sk = t2.customer_sk inner join customer_zip_code_dim t3 on t1.customer_zip_code_sk = t3.zip_code_sk group by state order by state;
-- °´³ÇÊÐ²éÑ¯ÏúÊÛÁ¿ºÍÏúÊÛ¶îselect t3.city city,    count(distinct t2.customer_sk) sum_customer_num,    sum(order_amount) sum_order_amount from sales_order_fact t1 inner join customer_dim t2 on t1.customer_sk = t2.customer_sk inner join customer_zip_code_dim t3 on t1.customer_zip_code_sk = t3.zip_code_sk group by city order by city;    ³ÇÊÐÍ³¼Æ±ýÍ¼ÈçÏÂÍ¼ËùÊ¾¡£

   ´ÓÍ¼ÖÐ¿ÉÒÔ¿´µ½£¬mechanicsburgÊÐµÄÏúÊÛÕ¼Õû¸öÏúÊÛ¶îµÄÒ»°ë¡£
£¨8£©ÔÙ½¨Á¢Ò»¸ö¡°°´ÄêÔÂÍ³¼Æ¡±µÄ²éÑ¯£¬Õâ´ÎÊ¹ÓÃ¶¯Ì¬±íµ¥¹¦ÄÜ£¬ÔËÐÐÊ±ÊäÈëÄê·Ý¡£SQLÓï¾äÈçÏÂ¡£-- °´ÄêÔÂ²éÑ¯ÏúÊÛÁ¿ºÍÏúÊÛ¶îselect t4.year*100 + t4.month ym,    sum(order_quantity) sum_quantity,    sum(order_amount) sum_amount from sales_order_fact t1 inner join order_date_dim t4 on t1.order_date_sk = t4.date_sk where (t4.year*100 + t4.month) between $ym1 and $ym2 group by ym order by ym;    ×¢Òâ$ym1ºÍ$ym2ÊÇ¶¯Ì¬²ÎÊý£¬Ö´ÐÐ´Ë²éÑ¯£¬»á³öÏÖÊäÈë¿òÒªÇóÊäÈë²ÎÊý£¬ÈçÏÂÍ¼ËùÊ¾¡£
   ²éÑ¯2016Ò»ÄêµÄÏúÊÛÇé¿ö£¬ym1ÊäÈë201601£¬ym2ÊäÈë201612£¬È»ºóµã»÷¡°Ö´ÐÐ²éÑ¯¡±£¬½á¹ûÏßÐÎÍ¼ÈçÏÂÍ¼ËùÊ¾¡£
   ´Ë½á¹û°´²éÑ¯Óï¾äÖÐµÄorder by×Ó¾äÅÅÐò¡£    ÖÁ´Ë£¬ÎÒÃÇ¶¨ÒåÁËÈý¸öImpala²éÑ¯£¬½øÈë¡°ÎÒµÄÎÄµµ¡±Ò³Ãæ¿ÉÒÔ¿´µ½defaultÏîÄ¿ÖÐÓÐÈý¸öÎÄµµ£¬¶ø¡°ÏúÊÛ¶©µ¥¡±ÏîÄ¿ÖÐÃ»ÓÐÎÄµµ£¬ÈçÏÂÍ¼ËùÊ¾¡£
£¨9£©°ÑÕâÈý¸öÎÄµµÒÆ¶¯µ½¡°ÏúÊÛ¶©µ¥¡±ÏîÄ¿ÖÐ¡£    µã»÷ÓÒÃæÁÐ±íÖÐµÄ¡°default¡±°´Å¥£¬»áµ¯³ö¡°ÒÆ¶¯µ½Ä³¸öÏîÄ¿¡±Ò³Ãæ£¬µã»÷¡°ÏúÊÛ¶©µ¥¡±£¬ÈçÏÂÍ¼ËùÊ¾¡£

   ½«Èý¸ö²éÑ¯ÎÄµµ¶¼Èç´Ë²Ù×÷ºó£¬ÔÚ¡°ÏúÊÛ¶©µ¥¡±ÏîÄ¿ÖÐ»á³öÏÖ´ËÈý¸öÎÄµµ£¬ÈçÏÂÍ¼ËùÊ¾¡£
   ÒÔÉÏÓÃÏúÊÛ¶©µ¥µÄÀý×ÓÑÝÊ¾ÁËÒ»ÏÂHueÖÐµÄImpala²éÑ¯¼°ÆäÍ¼ÐÎ»¯±íÊ¾¡£ÑÏ¸ñµØËµ£¬ÎÞÂÛÊÇHue»¹ÊÇZeppelin£¬ÔÚÊý¾Ý¿ÉÊÓ»¯ÉÏÓë´«Í³µÄBI²úÆ·Ïà±È»¹ºÜ³õ¼¶£¬ËüÃÇÖ»ÊÇÌá¹©ÁË¼¸ÖÖ³£¼ûµÄÍ¼±í£¬»¹È±ÉÙ»ù±¾µÄÉÏ¾í¡¢ÏÂ×ê¡¢ÇÐ¿é¡¢ÇÐÆ¬¡¢°Ù·Ö±ÈµÈ¹¦ÄÜ£¬Èç¹ûÖ»ÏëÓÃHadoopÉúÌ¬È¦ÀïµÄÊý¾Ý¿ÉÊÓ»¯¹¤¾ß£¬Ò²Ö»ÄÜÆÚ´ýÆäÖð²½ÍêÉÆ°É¡£
£¨10£©×îºóÌá¹©Ò»¸öHueÎÄµµÖÐÍ¨¹ý¾Î³¶È½øÐÐµØÍ¼¶¨Î»µÄÊ¾Àý£¬Æä½ØÍ¼ÈçÏÂËùÊ¾¡£

2. DB²éÑ¯    È±Ê¡Çé¿öÏÂHueÃ»ÓÐÆôÓÃDB²éÑ¯£¬Èç¹ûµã»÷¡°Query Editors¡± -> ¡°DB ²éÑ¯¡±£¬»áÌáÊ¾¡°µ±Ç°Ã»ÓÐÒÑÅäÖÃµÄÊý¾Ý¿â¡£¡±£¬ÈçÏÂÍ¼ËùÊ¾¡£
   °´ÈçÏÂ·½·¨ÅäÖÃDB²éÑ¯¡££¨1£©½øÈëCDH ManagerµÄ¡°Hue¡± -> ¡°ÅäÖÃ¡±Ò³Ãæ£¬ÔÚ¡°Àà±ðÖÐÑ¡Ôñ¡°·þÎñ·¶Î§¡± -> ¡°¸ß¼¶¡±£¬È»ºó±à¼¡°hue_safety_valve.ini µÄ Hue ·þÎñ¸ß¼¶ÅäÖÃ´úÂë¶Î£¨°²È«·§£©¡±ÅäÖÃÏî£¬ÌîÐ´ÀàËÆÈçÏÂÄÚÈÝ£º[] [[]]    # Name to show in the UI.    nice_name="MySQL DB"    name=hive    engine=mysql    host=172.16.1.102    port=3306    user=root    password=mypassword    ÕâÀïÅäÖÃµÄÊÇÒ»¸öMySQLÊý¾Ý¿â£¬ÈçÏÂÍ¼ËùÊ¾¡£

£¨2£©µã»÷¡°±£´æ¸ü¸Ä¡±°´Å¥£¬È»ºóµã»÷¡°²Ù×÷¡± -> ¡°ÖØÆô¡±£¬ÖØÆôHue·þÎñ¡£    ´ËÊ±ÔÙ´ÎÔÚHueÀïµã»÷¡°Query Editors¡± -> ¡°DB ²éÑ¯¡±£¬Ôò»á³öÏÖMySQLÖÐhive¿â±í£¬´Ë¿â´æ·ÅµÄÊÇHiveÔªÊý¾Ý¡£´ËÊ±¾Í¿ÉÒÔÊäÈëSQL½øÐÐ²éÑ¯ÁË£¬ÈçÏÂÍ¼ËùÊ¾¡£

3. ½¨Á¢¶¨ÆÚÖ´ÐÐÏúÊÛ¶©µ¥Ê¾ÀýµÄETL¹¤×÷Á÷    ÏÂÃæËµÃ÷½¨Á¢¹¤×÷Á÷µÄÏêÏ¸²½Öè¡££¨1£©µÇÂ¼HueµÄWebÖ÷Ò³£¬µã»÷¡°Workflows¡± -> ¡°±à¼Æ÷¡± -> ¡°Workflow¡±£¬´ò¿ª¡°Workflow ±à¼Æ÷¡±Ò³Ãæ£¬ÈçÏÂÍ¼ËùÊ¾¡£

£¨2£©µã»÷¡°Create¡±°´Å¥£¬ÐÂ½¨Ò»¸ö¹¤×÷Á÷£¬Ò³ÃæÈçÏÂÍ¼ËùÊ¾¡£
   ´ÓÍ¼ÖÐ¿´µ½£¬¹¤×÷Á÷Ô¤¶¨ÒåÁË16ÖÖ²Ù×÷£¬¶øÇÒStart¡¢End¡¢Kill½ÚµãÒÑ¾´æÔÚ£¬²»ÐèÒª£¨Ò²²»ÄÜ£©×Ô¼º¶¨Òå¡£
£¨3£©µã»÷Í¼±ê£¬´ò¿ª¹¤×÷ÇøÒ³Ãæ£¬ÈçÏÂÍ¼ËùÊ¾¡£

£¨4£©µã»÷Í¼±ê£¬ÏÔÊ¾HDFSÉÏµÄ¹¤×÷ÇøÄ¿Â¼¡££¨5£©Ö´ÐÐÏÂÃæµÄÃüÁî£¬½«Ïà¹ØÒÀÀµÎÄ¼þ¿½±´ÖÁ¹¤×÷ÇøÄ¿Â¼¡£hdfs dfs -put -f /root/mysql-connector-java-5.1.38/mysql-connector-java-5.1.38-bin.jar /user/hue/oozie/workspaces/hue-oozie-1472779112.59hdfs dfs -put -f /etc/hive/conf.cloudera.hive/hive-site.xml /user/hue/oozie/workspaces/hue-oozie-1472779112.59hdfs dfs -put -f /root/regular_etl.sql /user/hue/oozie/workspaces/hue-oozie-1472779112.59hdfs dfs -put -f /root/month_sum.sql /user/hue/oozie/workspaces/hue-oozie-1472779112.59£¨6£©»Øµ½¡°Workflow ±à¼Æ÷¡±Ò³Ãæ£¬ÍÏ×§Ìí¼ÓÈý¸ö¡°Sqoop 1¡±²Ù×÷£¬ÈçÏÂÍ¼ËùÊ¾¡£
   ¿ÉÒÔ¿´µ½£¬ÒòÎªÈý¸öSqoop²¢ÐÐ´¦Àí£¬ËùÒÔ¹¤×÷Á÷ÖÐ×Ô¶¯Ìí¼ÓÁËfork½ÚµãºÍjoin½Úµã¡££¨7£©±à¼Èý¸ö¡°Sqoop 1¡±²Ù×÷¡£    µÚÒ»¸ö¡°Sqoop 1¡±²Ù×÷¸ÄÃûÎª¡°sqoop-customer¡±    a. Sqoop ÃüÁîÌîÐ´ÈçÏÂÃüÁî£¬ÓÃimportÈ«Á¿×°ÔØ¿Í»§±í£ºimport --connect jdbc:mysql://cdh1:3306/source?useSSL=false --username root --password mypassword --table customer --hive-import --hive-table rds.customer --hive-overwrite    b. µã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñhive-site.xmlÎÄ¼þ¡£    c. ÔÙ´Îµã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñmysql-connector-java-5.1.38-bin.jarÎÄ¼þ¡£    µÚ¶þ¸ö¡°Sqoop 1¡±²Ù×÷¸ÄÃûÎª¡°sqoop-product¡±    a. Sqoop ÃüÁîÌîÐ´ÈçÏÂÃüÁî£¬ÓÃimportÈ«Á¿×°ÔØ²úÆ·±í£ºimport --connect jdbc:mysql://cdh1:3306/source?useSSL=false --username root --password mypassword --table product --hive-import --hive-table rds.product --hive-overwrite    b. µã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñhive-site.xmlÎÄ¼þ¡£    c. ÔÙ´Îµã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñmysql-connector-java-5.1.38-bin.jarÎÄ¼þ¡£    µÚÈý¸ö¡°Sqoop 1¡±²Ù×÷¸ÄÃûÎª¡°sqoop-sales_order¡±    a. Sqoop ÃüÁîÌîÐ´ÈçÏÂÃüÁî£¬ÓÃjobÔöÁ¿×°ÔØÏúÊÛ¶©µ¥±í£ºjob --exec myjob_incremental_import --meta-connect jdbc:hsqldb:hsql://cdh2:16000/sqoop    b. µã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñhive-site.xmlÎÄ¼þ¡£    c. ÔÙ´Îµã»÷¡°ÎÄ¼þ¡±£¬ÔÚ¡°Ñ¡ÔñÎÄ¼þ¡±Ò³Ãæµã»÷¡°¹¤×÷Çø¡±£¬Ñ¡Ôñmysql-connector-java-5.1.38-bin.jarÎÄ¼þ¡££¨8£©ÐÞ¸Ä¹¤×÷Á÷µÄÃû³ÆÎª¡°regular_etl¡±£¬Ìí¼Ó¹¤×÷Á÷µÄÃèÊöÎª¡°ÏúÊÛ¶©µ¥¶¨ÆÚETL¡±£¬fork½ÚµãµÄÃû³ÆÎª¡°fork-node¡±£¬join½ÚµãµÄÃû³ÆÎª¡°join-node¡±¡£ÏÖÔÚµÄ¹¤×÷Á÷ÈçÏÂÍ¼ËùÊ¾¡£
£¨9£©ÔÚ¡°join-node¡±½ÚµãÏÂ£¬ÍÏ×§Ìí¼ÓÒ»¸ö¡°Hive ½Å±¾¡±²Ù×÷£¬¡°½Å±¾¡±Ñ¡Ôñ¹¤×÷ÇøÄ¿Â¼ÏÂµÄregular_etl.sqlÎÄ¼þ£¬¡°Hive XML¡±Ñ¡Ôñ¹¤×÷ÇøÄ¿Â¼ÏÂµÄhive-site.xmlÎÄ¼þ¡£ÐÞ¸Ä²Ù×÷Ãû³ÆÎª¡°hive-every-day¡±¡£´Ë²Ù×÷Ã¿ÌìÖ´ÐÐETLÖ÷Á÷³Ì¡££¨10£©ÔÚ¡°hive-every-day¡±²Ù×÷ÏÂ£¬ÍÏ×§Ìí¼ÓÒ»¸ö¡°Hive ½Å±¾¡±²Ù×÷£¬¡°½Å±¾¡±Ñ¡Ôñ¹¤×÷ÇøÄ¿Â¼ÏÂµÄmonth_sum.sqlÎÄ¼þ£¬¡°Hive XML¡±Ñ¡Ôñ¹¤×÷ÇøÄ¿Â¼ÏÂµÄhive-site.xmlÎÄ¼þ¡£ÐÞ¸Ä²Ù×÷Ãû³ÆÎª¡°hive-every-month¡±¡£´Ë²Ù×÷Ã¿¸öÔÂÖ´ÐÐÒ»´Î£¬Éú³ÉÉÏÔÂ»ã×ÜÊý¾Ý¿ìÕÕ¡£ÏÖÔÚµÄ¹¤×÷Á÷ÈçÏÂÍ¼ËùÊ¾£¨¡°join-node¡±¼°ÆäÒÔÏÂ²¿·Ö£©¡£
£¨11£©Õâ²½ÒªÊ¹ÓÃÒ»¸öÐ¡¼¼ÇÉ¡£hive-every-monthÊÇÃ¿¸öÔÂÖ´ÐÐÒ»´Î£¬ÎÒÃÇÊÇÓÃÌì×öÅÐ¶Ï£¬±ÈÈçÃ¿ÔÂ1ÈÕÖ´ÐÐ´Ë²Ù×÷£¬ÐèÒªÒ»¸ödecision½ÚµãÍê³Édate eq 1µÄÅÐ¶Ï¡£ÔÚHueµÄ¹¤×÷Á÷±à¼Àï£¬decision½ÚµãÊÇÓÉfork½Úµã×ª»»À´µÄ£¬¶øfork½ÚµãÊÇÅöµ½²¢·¢²Ù×÷Ê±×Ô¶¯Ìí¼ÓµÄ¡£Òò´ËÐèÒªÌí¼ÓÒ»¸öºÍ¡°hive-every-month¡±²Ù×÷²¢·¢µÄ²Ù×÷À´×Ô¶¯Ìí¼Ófork½Úµã¡£ÕâÀïÑ¡Ôñ¡°Í£Ö¹¡±²Ù×÷¡£ÏÖÔÚµÄ¹¤×÷Á÷ÈçÏÂÍ¼ËùÊ¾£¨¡°hive-every-day¡±¼°ÆäÒÔÏÂ²¿·Ö£©¡£
£¨12£©µã»÷¡°×ª»»Îª¾ö²ß¡±£¬Ìõ¼þÊÇÈç¹û${date eq 1}×ªÖÁ¡°hive-every-month¡±£¬·ñÔò×ªÖÁ¡°End¡±¡£ÒòÎª²»ÊÇ1ºÅÊ±»á×ªÖÁÈ±Ê¡µÄ¡°End¡±½Úµã£¬ËùÒÔ´ËÊ±ÒÑ¾²»ÔÙÐèÒª¸Õ²ÅÌí¼ÓµÄ¡°Í£Ö¹¡±²Ù×÷£¬½«ÆäÉ¾³ý¡£ÏÖÔÚµÄ¹¤×÷Á÷ÈçÏÂÍ¼ËùÊ¾£¨¡°hive-every-day¡±¼°ÆäÒÔÏÂ²¿·Ö£©¡£
   ÖÁ´ËÎÒÃÇµÄregular_etl¹¤×÷Á÷ÒÑ¾¶¨ÒåÍê³É£¬µã»÷Í¼±ê±£´æ£¬ÔÚ·Ç±à¼Ä£Ê½ÏÂ£¬ÍêÕûµÄ¹¤×÷Á÷ÈçÏÂÍ¼ËùÊ¾¡£
£¨13£©µã»÷¡°ÉèÖÃ¡±£¬ÔÚµ¯³öµÄ¡°Workflow ÉèÖÃ¡±Ò³ÃæÀïµã»÷¡°Ìí¼Ó²ÎÊý¡±Á´½Ó£¬²ÎÊýÃûÎª¡°date¡±£¬ÖµÉèÖÃÎª1£¬ÈçÏÂÍ¼ËùÊ¾¡£

£¨14£©¹Ø±Õ¡°Workflow ÉèÖÃ¡±Ò³Ãæ£¬µã»÷ ¡°Ìá½»¡±£¬µ¯³ö¡°Ìá½» regular_etl?¡±Ò³Ãæ£¬²ÎÊýdateÖµÎª1£¬ÈçÏÂÍ¼ËùÊ¾¡£

£¨15£©µã»÷¡°Ìá½»¡±°´Å¥£¬¹¤×÷Á÷Ö´ÐÐ£¬Ö´ÐÐ³É¹¦½á¹ûÈçÏÂÍ¼ËùÊ¾¡£
   Ç°ÃæµÄ²½Öè¶¨ÒåÁËWorkflow¹¤×÷Á÷£¬ÒªÈÃËü¶¨Ê±Ö´ÐÐ»¹Òª¶¨ÒåCoordinator¹¤×÷Á÷¡£
£¨16£©µã»÷¡°Workflows¡± -> ¡°±à¼Æ÷¡± -> ¡°Workflow¡±£¬´ò¿ª¡°Coordinator ±à¼Æ÷¡±Ò³Ãæ£¬ÈçÏÂÍ¼ËùÊ¾¡£
£¨17£©µã»÷¡°Create¡±°´Å¥£¬ÐÂ½¨Ò»¸ö¹¤×÷Á÷£¬Ò³ÃæÈçÏÂÍ¼ËùÊ¾¡£
£¨18£©µã»÷¡°Ñ¡Ôñ Workflow¡±Á´½Ó£¬ÔÚµ¯³öµÄÒ³ÃæÖÐÑ¡Ôñ¡°regular_etl¡±£¬ÈçÏÂÍ¼ËùÊ¾¡£
£¨19£©¡°ÆµÂÊ¡±ÅäÖÃ²»±ä£¬±£³ÖÈ±Ê¡µÄÃ¿ÌìÒ»´Î¡££¨20£©µã»÷¡°Ìí¼Ó²ÎÊý¡±Á´½Ó£¬½«${coord:formatTime(coord:actualTime(), 'd')}×÷Îªregular_etlÀï±äÁ¿dateµÄÖµ£¬´«µÝ¸øWorkflow¡££¨21£©ÐÞ¸ÄCoordinator¹¤×÷Á÷µÄÃû³ÆÎª¡°regular_etl-coord¡±£¬µã»÷±£´æ¡£    ÖÁ´ËÎÒÃÇµÄCoordinator¹¤×÷Á÷ÒÑ¾¶¨ÒåÍê³É£¬ÏÖÔÚµÄ¹¤×÷Á÷ÔÚ·Ç±à¼Ä£Ê½ÏÂÈçÏÂÍ¼ËùÊ¾¡£
£¨22£©µã»÷¡°Ìá½»¡±£¬µÈ´ýCoordinator¹¤×÷Á÷Ö´ÐÐ£¬Ö´ÐÐ³É¹¦½á¹ûÈçÏÂÍ¼ËùÊ¾¡£
--------------------- ×÷Õß£ºwzy0623 À´Ô´£ºCSDN ÔÎÄ£ºhttps://blog.csdn.net/wzy0623/article/details/52386016

Ò³: [1]

168´óÊý¾Ý's Archiver

»ùÓÚhadoopÉúÌ¬È¦µÄÊý¾Ý²Ö¿âÊµ¼ù ¡ª OLAPÓëÊý¾Ý¿ÉÊÓ»¯£¨¶þ£©