? ???? ? ?? : Apache Spark ? Jupyter? ???? Linux ??? ?? ??
Mar 08, 2025 am 09:08 AM
??
???? ??? ?? ????? ??? ???? ???? ???? ??? ????, ??? ? ?? ??? ?????. ? ??? ??? ??? ??? ???? ??? ???? ???? ? ?? ????????. ?? ??? ?? ?? ? Apache Spark ? Jupyter Notebook? ?? Linux ???? ?? ? ? ??? ?? ????? ??????. ? ??? ??? ??? ??? ??? ???? Apache Spark ? Jupyter? ???? Linux?? ? ??? ??? ???? ???? ?????. ?? ??
? ??? ??
? ???? ?? ??? ?? ??? ?????? ?? ??? ?? ????? ?? ?? ???? ??? ??? ?????. ??? 4 ?? v :??? ?? (??) : ?? ???, ?? ? ?? ???? ?? ??? ???? ?? ?? ? ???? ?? ??. ?? (Velocity)
: ??? ???? ???? ?? ???? ??.??? (??) : ???, ? ??? ? ????? ?? ???? ??? ??? ??? ???.
- ??? (???)
- : ??? ???? ???? ???? ???? ???? ???? ???? ?????.
? ??? ??? ??, ??, ??? ? ??? ?? ???? ??? ????? ??? ???? ?? ?? ??? ???? ??? ?? ? ? ??????.
??? ??? ?? - ??? ??? ??? ??, ????, ???? ? ???? ???? ????? ?? ????? ??? ???? ???? ?? ? ?????. ??? ??? ?? ?? ??? ??? ???? ??? ?? (??? ??) : ??? ???? ???? ?????.
- ??? ?? (??? ??) : ?? ??? ???? ?? ???? ???? ?????. ??? ?? : ???? ???? ?? ?? ? ?? ?? ??? ??????.
-
??? ??? : ???? ????? ???? ?? ??? ??? ????.
??? ?????? ???? ?? ?? ??, ????? ??, ?? ? ?? ??? ???? ????? ???? ???? ?????.
?? ?? ??, ?? ??? ? ????? ?? Linux? ?? ??? ????? ???? ?? ?????. ??? ? ?? ?? ????? :
-
?? ?? : Linux? ??? ???? ???? ??? ???? ??? ??? ?? ? ? ????.
- ??? ? ?? : Linux? ???? ???? ???? ???? ??? ??? ??? ????? ???? ?????. Security (Security) : Linux? ?? ??? ???? ??? ???? ????? ??? ??? ?????.
- ???? ?? (Community Support) : ?? ? Linux ????? ??? ?? ????? ??? ???, ?? ? ??? ?????. Apache Spark : ? ??? ????? ??? ??
- Apache Spark ?? Apache Spark? ? ??? ??? ?? ??? ?? ?? ?? ?? ?????. Hadoop Mapreduce? ??? ?????? ??? ???? ??? ?? ??? ???? ?? ???????. ???? ?? ??? ??? ???? ?? (??)
- : ??? ??? ?? Spark? Hadoop Mapreduce?? 100 ? ??? ??? ? ????. ?? ??? ??? : Spark? ?? ??, ??? ??, ?? ?? ? ??? ??? ??? ??? ??? ?? ??? ?????.
Spark? ?? ?? ?? - Spark Core ? RDD (?? ?? ??? ??) : Spark 's Foundation, ?? ??? ?? ? ?? ??? ?? ?? ??? ?????.
Spark SQL : SQL ?? DataFrame API? ???? ??? ? ???? ?? ? ? ??????. ??? ????
: ??? ??? ??? ?????.-
mllib
- : ?? ?? ???? ?????. ??? : ??? ?? ? ??? ?????.
-
Linux?? Apache Spark? ?? ??? ?? ?? ? ?? ??
Spark? ???? ?? ???? ?? ?? ??? ????? ??????.
-
?? ?? (?? ??) : Linux (?? ??)
java
- : JDK 8 ?? Scala : ?? ????? Advanced Spark ??? ?????. python : ?? ????? PySpark? ?????. ?? ?? ??? Java? ??
- :
Spark? ?????? ??????
wget
http://m.miracleart.cn/link/94f338fe2f7f9a84751deeefae6bcba2
?? XVF Spark-3.1.2-Bin-Hadoop3.2.tgz
Sudo MV Spark-3.1.2-Bin-Hadoop3.2 /Opt /Spark
- ?? ?? ??? ?? :
??? ?????? :
?? ? ?? ??-
Jupyter : ??? ??? ?? ??
Jupyter Notebook ??
sudo apt-get update sudo apt-get install default-jdk
Jupyter Notebook? ??? ??, ???, ??? ? ???? ???? ?? ? ??? ???? ?? ? ??? ?? ?? ? ?? ???????. Python, R ? Julia? ??? ??? ????? ??? ?????.
??? ??? Jupyter? ???? ?? - ??? ??? : ???? ?????? ?? ???? ????.
?? ??? : ??? ?? ? ?? ????? ??? ? ?????.
<code></code>
?? (??) : ?? ?? ??? ?? ???? ???? ?????. -
?? ??? ?? : ??? ????? ??? ?????.
echo "export SPARK_HOME=/opt/spark" >> ~/.bashrc echo "export PATH=$SPARK_HOME/bin:$PATH" >> ~/.bashrc source ~/.bashrc
Linux?? Jupyter? ?? ??? ?? ?? ? ?? ??
??? ??, ?? ?? ? ?? ??? ?? ??? ???? ?? ??? ???? Spark? ??????. ???? ???? ???? ??? ??????. ?? ???? ??????. spark-shell
?? ?? ???
??? ? PIP ?? :
Jupyter? ?? : - findspark ?? :
-
??? ?? ? ???? ??? ??????
??? ????? ??? ??? ??? ??????. pip3 install findspark
?? ??? ??? ? ?? ? ??? ??? ?? ? ???? ????? ??? ?? ??? ?? ? ???? ??? ??? ?? Kaggle? ????? ???? ??? ??? ?????.??? ? ??? ??? ?? ? ??? ?? ??? :
??? ?? :
<code></code>
Jupyter? ??? ??? ?? ? ??? ?? ?? :
???
:<code></code>
?? ?? ? ???
?? ?? ??? ??? ?? ??? ?? ??? ?? ???? ?????? ??? ? ?? ??? ?????. ?? ?? ? ?? ?? Spark? ?? ??? - ???? ??? ?? : ? ?? ??? ?? DataFrame ? DataSet API? ??????.?? ?? : ????? ?? ??? ??? ?????.
-
jupyter - jupyterhub ? ?? ?? ??? ?? : Jupyterhub? ???? ? ?? ??? ?????? ?? ??? ??? ????.
df = spark.read.csv("titanic.csv", header=True, inferSchema=True)
??? ?? - : ?? ??? ?? github ?? nbviewer? ?? ???? ?????.
?? ?? ??
df = df.dropna(subset=["Age", "Embarked"])
- Data Security (??? ??) : ??? ???? ???? ?? ??? ? ??? ???? ?????.
- ?? ??? ? ?? :
df.describe().show()
??? ?? ?? :
?? Jupyter Notebook
?? Jupyter Notebook conf/spark-defaults.conf
:```
Jupyter Notebook
?? ? ?? ??
? ??? ??? ?? Apache Spark ? Jupyter? ?? Jupyter?? Spark? ??? ????? Spark? Jupyter? ?? Spark? ????? ?? ??? ?????. ??? ????? ??
PySpark? ?? :
pip3 install pyspark
???? ?? ????? Jupyter? ??????
??? ?? ?? (Linux ?? ??) : ???, ??? ? ???? ? ?? ??? ???? Linux ??? ??????.
??? ?? ? ????- -
import findspark findspark.init("/opt/spark") from pyspark.sql import SparkSession spark = SparkSession.builder \ .appName("Jupyter and Spark") \ .getOrCreate():
?? ? ????? Linux ????? Apache Spark? Jupyter? ??? ? ??? ??? ??? ??? ?????. Spark? ??? ???? Jupyter? ??? ??? ???? ??? ???? ??? ??? ??? ????? ???? ?? ? ? ????. ??? ??, ?? ? ?? ??? ??? ??? ??? ?? ?? ??? ?? ???? ?? ??? ???? ?? ?? ?? ??? ??? ? ????.
? ??? ? ???? ? ?? : Apache Spark ? Jupyter? ???? Linux ??? ?? ??? ?? ?????. ??? ??? PHP ??? ????? ?? ?? ??? ?????!

? AI ??

Undress AI Tool
??? ???? ??

Undresser.AI Undress
???? ?? ??? ??? ?? AI ?? ?

AI Clothes Remover
???? ?? ???? ??? AI ?????.

Clothoff.io
AI ? ???

Video Face Swap
??? ??? AI ?? ?? ??? ???? ?? ???? ??? ?? ????!

?? ??

??? ??

???++7.3.1
???? ?? ?? ?? ???

SublimeText3 ??? ??
??? ??, ???? ?? ????.

???? 13.0.1 ???
??? PHP ?? ?? ??

???? CS6
??? ? ?? ??

SublimeText3 Mac ??
? ??? ?? ?? ?????(SublimeText3)

DNS ??? ??? ? ?? /etc/resolv.conf ??? ???? ??? ?? ??? ???? ??? ??????. ??, ???? ?? 8.8.8.8? ?? ?? DNS? ???? ?? ? ? ????. ?? ?? NSLookup ? DIG ??? ???? DNS ???? ???? ??????. ??? ??? ???? ?? ?? ?? DNSUTILS ?? BAND-UTILS ???? ??? ? ????. ?? ?? SystemD-Resolved ??? ?? ? ?? ?? /etc/systemd/resolved.conf? ???? ??? ?? DNS ? FallbackDns? ???? ???? ?? ??????. ????? ???? ????? ?? ? ??? ??? ???? ?? 53?

??? ??? ?? ???? ??? ???? ?? ??? ???? ?? ??? ???????. ?? ??? ??? ???? ???? Top, HTOP, Free-H, Iostat, SS-ANTP ? ?? ??? ???? CPU, ???, ??? I/O ? ???? ??? ???????. ??, ?? ???? ??? ???? PS, JSTACK, Strace? ?? ??? ?? ??? ????? ??? ?????. ?? ?? ?? ? ???? ???? ???? OOM ?????, ?? ??, ?? ?? ? ?? ??; ?????, ??? ??, ?? ? ??, ?? ?? ?? ? ??? ?? ??, ?? ?? ???, ?? ?? ? ?? ????? ???? ?? ?? ??? ???? ????? ?? ?? ? ?? ???? ?? ???? ??? ?? ??? ??? ?????.

??? ????? Windows? Linux? ???? ???? ?? (?? ?? ???)? ?? ? ? ????. ?? ???? Windows ???? ?? ?? ???? ????? ??????? ?? ??? ????.

Linux Systems?? 1. IPA ?? HostName-I ??? ???? ?? IP?????. 2. curlifconfig.me ?? curlipinfo.io/ip? ???? ?? IP? ????. 3. ???? ??? ??? ??? ?? ?? IP? ? ? ??? ????? ?? ? ???? ????? ?? IP? ? ? ????. 4. ?? ??? ?? ????? ???? ??? ? ????. ??? ??? ???? ????? ??? ?????? IP ?? ??? ?????.

Chrome? V8 ??? ?????? Node.js? ?? ??? ?? ???? ? ??? API? ???? ?? ?? ? ?? ?? ??? ??? JavaScript ??? ?????. Nodejs? ? ??? I/O ??? ?? ??? ???? ??? ??? ????.

LinuxCanRunonOnModestHardWareWithSpecificminIumpiRements.a1ghzprocessor (x86orx86_64)? withedual-corecperececended.r AMSHOUDDBEATLEAST512MBFORCOMMAND-LINEUSOR2GBFORDESKTOPENVIRONTMENTS.DISKSPACEREQUIRESAMINIMUMOF5–10GB, ??? 25GBISBETTERFORAD

? ????? Redhat?? ?? ? YUM (YoulyDog Updater Modified) ??? ???? Linux ????? ??? ? ?????? ??, ????, ??, ??? ? ????? ???? ??? ????. ? ??? ??? ?? ??? ??????

C? ??? MySQL? ?? ??, ??? ??? ? ?? ?? ???? ??? ?????? ?? ??? (RDMS) ? ?????. ?? ??? ?? ???? ? ???, ??? ??, ???? ?????? ?? ??????.
