TurboWay/bigdata_analyse

大数据分析项目

PythonHiveQLpythonsqlhql
This is stars and forks stats for /TurboWay/bigdata_analyse repository. As of 29 Mar, 2024 this repository has 3060 stars and 602 forks.

bigdata_analyse 该 repo 是本人实践过的数据分析项目集合,每个项目都会包含一个友好的说明文档,用来阐述和展示整个开发流程,同时也会提供相关的数据集,以供下载练习。 wish 采用不同的技术栈,通过对不同行业的数据集进行分析,期望达到以下目的: 了解不同领域的业务分析指标 深化数据处理、数据分析、数据可视化能力 增加大数据批处理、流处理的实践经验 增加数据挖掘的实践经验 tip 项目主要使用的编程语言是 python、sql、hql .ipynb 可以用 jupyter notebook 打开,如何安装, 可以参考 jupyter notebook jupyter notebook 是一种网页交互形式的 python 编辑器,直接通过 pip 安装,也支持 markdown,很适合用来做数据分析可视化以及写文章、写示例代码等。 list 主题 处理方式 技术栈 数据集下载 1 亿条淘宝用户行为数据分析 离线处理 清洗 hive + 分析 hive + 可视化 echarts 阿里云 或者 百度网盘 提取码:5ipq 1000 万条淘宝用户行为数据实时分析 实时处理 数据源...
Read on GithubGithub Stats Page
repotechsstarsweeklyforksweekly
HuskyHacks/cve-2022-33891Python82+1200
thu-ml/tianshouPython6.7k01k0
mouredev/Code-Challenges5700670
RadeonOpenCompute/rocm-cmakeCMakeCC++430390
JuliaDynamics/GoodScientificCodeWorkshopJuliaPython2080170
pesser/stable-diffusionJupyter NotebookPythonShell997+1377+1
udacity/DevOps_MicroservicesJupyter NotebookPythonMakefile18501.5k+2
skywind3000/z.luaLuaPythonShell2.8k+61440
wilfredinni/python-cheatsheetVueTypeScriptCSS3.7k+121.2k+3
mmp/pbrt-v3C++CPython4.7k01.2k0