-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy paththesis.tex
More file actions
executable file
·165 lines (143 loc) · 5.19 KB
/
thesis.tex
File metadata and controls
executable file
·165 lines (143 loc) · 5.19 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
%%
%% This is file `thesis.tex',
%% generated with the docstrip utility.
%%
%% The original source files were:
%%
%% nudtpaper.dtx (with options: `thesis')
%%
%% This is a generated file.
%%
%% Copyright (C) 2018 by TomHeaven <hanlin_tan@nudt.edu.cn>
%%
%% This file may be distributed and/or modified under the
%% conditions of the LaTeX Project Public License, either version 1.3a
%% of this license or (at your option) any later version.
%% The latest version of this license is in:
%%
%% http://www.latex-project.org/lppl.txt
%%
%% and version 1.3a or later is part of all distributions of LaTeX
%% version 2004/10/01 or later.
%%
%% To produce the documentation run the original source files ending with `.dtx'
%% through LaTeX.
%%
%% Thanks LiuBenYuan <liubenyuan@gmail.com> for maintainence.
%% Thanks Xue Ruini <xueruini@gmail.com> for the thuthesis class!
%% Thanks sofoot for the original NUDT paper class!
%%
%1. 规范硕士导言
% \documentclass[master,ttf]{nudtpaper}
%2. 规范博士导言
% \documentclass[doctor,twoside,ttf]{nudtpaper}
%3. 如果使用是Vista
% \documentclass[master,ttf,vista]{nudtpaper}
%4. 建议使用OTF字体获得较好的页面显示效果
% OTF字体从网上获得,各个系统名称统一,不用加vista选项
% 如果你下载的是最新的(1201)OTF英文字体,建议修改nudtpaper.cls,使用
% Times New Roman PS Std
% \documentclass[doctor,twoside,otf]{nudtpaper}
% 另外,新版的论文模板提供了方正字体选项FZ,效果也不错哦
% \documentclass[doctor,twoside,fz]{nudtpaper}
%5. 如果想生成盲评,传递anon即可,仍需修改个人成果部分
% \documentclass[master,otf,anon]{nudtpaper}
%
\documentclass[master,otf]{nudtpaper}
%%----DELETE-----%
%\usepackage{notes}
%\numberwithin{equation}{chapter}
%\numberwithin{figure}{chapter}
%%----DELETE-----%
%\usepackage{pdfpages}
\usepackage{lmodern}
\usepackage{mynudt}
\usepackage{multirow,array}
\classification{TP399}
\serialno{17060062}
\confidentiality{公开}
\UDC{004.8}
\title{基于自然语言处理的热点数据识别\\及应用技术研究}
%\title{基于自然语言模型的文件访问模式分析与文件预取方法研究}
\displaytitle{基于自然语言处理的热点数据识别及应用技术研究}
\author{陈辉}
\zhdate{\zhtoday}
\entitle{Research on Hot File Identification and Application Technology Based on Natural Language Processing}
\enauthor{Hui Chen}
\endate{\entoday}
\subject{计算机科学与技术}
\ensubject{Computer Science and Technology}
\researchfield{高性能计算}
\supervisor{周恩强\quad{}研究员}
\cosupervisor{} % 协助指导教师,没有就空着
\ensupervisor{Prof. Enqiang Zhou}
\encosupervisor{} % 协助指导教师英文,没有就空着
\papertype{工学}
\enpapertype{Engineering}
% 加入makenomenclature命令可用nomencl制作符号列表。
\begin{document}
\graphicspath{{fig/}}
% 制作封面,生成目录,插入摘要,插入符号列表 \\
% 默认符号列表使用denotation.tex,如果要使用nomencl \\
% 需要注释掉denotation,并取消下面两个命令的注释。 \\
% cleardoublepage% \\
% printnomenclature% \\
\maketitle
\frontmatter
\tableofcontents
\listoftables
\listoffigures
\midmatter
\input{data/abstract}
\mainmatter
\input{data/introduction}
% a) 不同存储层次存储介质,其性能和功能特点差异描述(数据、曲线),突出分层的意义。
% b) 缓存技术需要一个总结,阐明其问题缺陷,直接用于热点数据识别的劣势;
% 主动预取,需要丰富若干文献;
% c) 本章篇幅少,广度和深度不够。
\input{data/ts}
\input{data/nlp}
%分层存储和自然语言处理合并为一章:相关工作介绍,质量可以适当降低。
% 引言:概述分层存储特点-》分层存储管理的重要性->j
% 2.1 分层存储
% 2.1.1 分层存储模型
% 2.1.2 数据分类
% 2.1.3 分层存储管理
% 数据关联挖掘;N-GRAM模型;缺陷
% 2.2 自然语言处理相关技术
% 2.2.1 词嵌入:突出词嵌入能表达语义关联的特性;可视化展现;
% 2.2.2 循环神经网络:突出RNN在序列分析中的作用。举例LSTM用于内存访问预测的论文;
\input{data/models}
% 基于自然语言处理的文件分类模型
% 引言:放个总框图,直观展示两项主要工作
% 3.1 基于词嵌入模型的文件关联分析
% 3.1.1 具体模型(skip-gram+subword)
% 词与词之间关联;
% 线性相加后表达文件之间关联。
% 注意加图:skipgram的图
% 3.1.2 词向量模型可视化:
% tnse
% 3.2 基于RNN的冷热分类模型
% 3.2.1 基于单层GRNN的冷热分类模型
% 3.2.2 分类阈值讨论
\input{data/design}
% 引言:总框图,描述
% 4.1 客户端设计
% 4.2 服务端设计
\input{data/experiments}
%gluster tiering 模块实验
%针对工作负载的文件向量化实验(可视化)
%采用循环神经网络进行文件冷热分类
\input{data/summary}
\input{data/ack}
\cleardoublepage
\phantomsection
\addcontentsline{toc}{chapter}{参考文献}
\bibliographystyle{bstutf8}
\bibliography{ref/thesis}
\input{data/resume}
% 最后,需要的话还要生成附录,全文随之结束。
%\appendix
\backmatter
%\input{data/appendix01}
\end{document}