机器学习算法处理流量分类问题已经成为网络安全领域一个研究热点。为了提高大规模网络流的分类效率,引入并行SVM算法来识别网络流量, 提出了一种基于Spark平台的大规模网络流在线分类方案。该方案利用置信域牛顿法(TRON)并行优化线性SVM算法构建流量分类模型, 然后融合最新的实时计算框架, 实现对大规模网络流的在线识别。实验结果表明, 利用并行SVM算法在损失较小精度的前提下可以加快网络流的模型训练和分类速度, 符合大规模网络流在线分类的需要。