Persona - Core

To describe the architecture of persona and store configuration files.

Architecture

Deployment

bash install.sh

The systemd services will be generated: persona-offline, persona-realtime, persona-flume and persona-backend.
And you can use them as service.

Key points

user_tag_value, moc_post, moc_reply, moc_comment comes from mooc MySql.
wda_mooc maybe come from mooc HDFS.
Spark used for off-line data processing.
Spark Streaming used for real-time data processing.
Redis has been chosen for data caching.

How to choose MySql, HBase and Redis?
- Redis: the data is easy to lose, but fastest.
- HBase: data not lose. Is its deployment easy?
- MySql: too slow.

In indetermination

How to arrange persona - ml module?

Notes

persona大数据平台开发记录-1 业务逻辑数据导入

persona大数据平台开发记录-2 离线数据处理

persona大数据平台开发记录-3 实时日志收集与传输

persona大数据平台开发记录-4 部署过程

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.images		.images
persona-core-deploy		persona-core-deploy
persona-core-offline		persona-core-offline
persona-core-realtime		persona-core-realtime
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Persona - Core

Architecture

Deployment

Key points

In indetermination

Notes

About

Releases

Packages

Languages

persona-project/persona-core

Folders and files

Latest commit

History

Repository files navigation

Persona - Core

Architecture

Deployment

Key points

In indetermination

Notes

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages