Skip to main content

初识客户画像

一、什么是用户画像

用户画像就是给用户贴标签。
例如你追一个女生,你可以这样给用户贴标签
基本信息:张倩、23岁、成都人、168cm
职业:设计师,月入2万
外在:肤白貌美、前凸后翘、五官精致、长发飘飘、大腿修长
兴趣爱好:喜欢桌球、逛街、看电影、旅游
社交信息:办护照、问云南丽江旅游攻略
知道这些信息,你是不是就可以有目的的投其所好,然后开始你的追求计划!
上面是对一个人的用户画像,产品的用户画像是对一群人的进行贴标签,是对一群人共性特征的提炼。例如你搜索p2p,就会出现p2p的用户画像。主要集中在北上广深,年龄主要集中在20-39岁,且以男性居多,那么你要开一家p2p公司的时候就要选在北京、上海、做运营推广的时候主要找20-39岁的人群,这就是用户画像!

二、为什么要做用户画像

1、防止产品经理跑偏。产品经理做出来的产品是给用户用的,所以脑海中必须有什么样的用户在什么样的场景下使用这个产品,这样设计的东西才能满足用户需求,不带有你个人喜好。例如:你设计理财产品是给20-39岁的年轻人用的,但你却想着有老年人在投资你的产品,把字体设计的特别大,影响美观,也会导致部分目标用户群的流逝。
2、为运营推广提供支持。有了详细的用户画像,推广起来不仅效率高,而且也能降低ROI。例如你的投资理财产品主要针对是30-39岁的年薪在20万以上的目标人群,这些人群有啥特征?这些人群基本上都属于结婚没多久,小孩在上幼儿园的状态,你就可以在幼儿园的门口来加他们的微信,地推你们的产品,就是因为有了目标人群,然后分析目标人群特征,然后才能进行精准化的推广。

三、用户画像注意事项

1、用户画像建立在真实的数据之上。不论是你自己的数据还是引入外部的数据,比如你的理财产品的注册用户有很多垃圾用户,从其他渠道过来的垃圾用户,都不怎么投资,这个时候你做用户画像的时候就要把这部分人群给去掉。
2、多个用户画像,考虑用户优先级。一般不超过三个以上的用户画像,超过三个用户画像,在产品设计的时候会无所适从,产品设计的时候首先考虑满足首要用户画像,在不冲突的情况下满足次要用户画像,当一个产品非常复杂,在设计某个模块的时候,也要考虑用户画像的优先级,例如,购物网站,某一块是给女性设计的,就要站在女性的视角,从颜色、排版角度要考虑偏女性化,但是另外一个购物板块是给男性用的,可能就需要成熟、大气、稳重一些。
3、用户画像是在不断的修正中。刚开始做产品可能猜你的目标用户是什么样的人群,实际做出来可能有点偏差,然后开始修正,当你的数据更丰富的时候,可能用户画像又需要修正。比如:比如你现在在上海做理财产品,主要目标用户是上海的20-39岁人群,万一那天你的推广集中在杭州,你的用户画像中地域分布可能主要就集中在杭州了。

四、用户画像的五个维度

每个产品都要结合自己的业务进行用户画像,例如相亲APP可能在意用户的年龄、性别、家庭情况、经济状况(房车)、兴趣爱好、信用状况(防止酒托、骗子之类的),金融类APP可能主要是年龄、收入状况、信用状况等,对于一些其他无关信息身高、体重、星座就不需要了,又不是做模特招聘和直播的。我们主要从人口属性、信用属性、消费特征、兴趣爱好、社交属性进行划分,其他更多的维度可以根据自己的产品需要来定,一般这五个维度能够满足产品设计需求和业务需求。1、人口属性。主要描述一个人基本信息,姓名、联系方式、年龄、性别、电话号码、邮箱、家庭住址这些。知道这些信息,可以划分用户群,是年轻人、中年人、老年人、以及地域分布主要在啥地方,知道他们的联系方式可以确保你能联系到他们,对你的营销有帮助。
2、信用属性。主要描述用户收入情况、支付能力、以及信用情况。银行有余钱、芝麻信用分高的人一般有能力进行理财而且信用比较好,这些有利于了解信用情况,定位目标用户,客户职业、收入、资产、负债、学历、信用评分、芝麻信用分都属于信用信息。
3、消费特征。主要描述用户的消费习惯和消费偏好,用于寻找高频和高价值的用户,一个经常买买买的人,也是一个比较有财力,愿意花钱的人。为了方便筛选用户可以直接将客户定位为某些消费特征人群。例如一个人经常旅游,那么你就可以向他推销旅行险,一个人刚买车,你就可以将他的车抵押向他放贷等,如果你的客户是经常买奶粉,你可以在你的产品上做个积分商城,商城里面的产品有奶粉。
4、兴趣爱好。用于描述客户有哪方面的兴趣爱好。例如你的用户经常去看一些戏剧啥的,听交响乐。那么他有可能是中产阶级,比较有钱,你可以好好维护吗,这里要说明的一点就是兴趣爱好和消费特征可能部分有重复,区别在于数据来源不同,消费特征来源于已有的消费记录,但是我买来的东西不一定是自己用,但是兴趣爱好代表本人真实的兴趣。例如户外运动爱好者、旅游爱好者、电影爱好者、健身爱好者、奢侈品爱好者。掌握这些信息可以方便你做运营,比如客户是电影爱好者,那么你就可以做一个活动说投资送电影票。至于这些数据怎么获取,可以通过社交信息和地理位置信息来获取。经常去电影区是电影爱好者,经常去健身房是健身爱好者…
5、社交信息。用于描述用户在社交媒体的评论,这些信息往往代表用户内心的真实想法和需求,具有时效性高,转化率高的特点。例如用户询问房屋贷款哪家多?你就可以向他推荐贷款,如果企业及时了解到这些信息,可以有效的进行推广

Linux Swap分区

背景介绍

  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存的造价是要高于磁盘的,且内存的断电丢失数据也是不能把所有数据和程序都保存在内存中的原因。
  既然不能全部使用内存,那数据还有程序不可能一直霸占在内存中。当内存没有可用的,就必须要把内存中不经常运行的程序踢出去。但是踢到哪里去,这时候swap就出现了。
  Swap全称为swap place,即交换分区。当内存不够的时候,被踢出的进程被暂时存储到交换区。当需要这条被踢出的进程时,就从交换区重新加载到内存,否则它不会主动交换到真实内存中。

Swap介绍

  在详细介绍swap之前,需要知道的是计算机内存分为物理内存与虚拟内存(注意虚拟内存和虚拟地址空间的区别)。
  物理内存是计算机的实际内存大小,由RAM芯片组成。虚拟内存则是虚拟出来的、使用磁盘代替内存。虚拟内存的出现,让机器内存不够的情况得到部分解决。当程序运行起来由操作系统做具体虚拟内存到物理内存的替换和加载(相应的页与段的虚拟内存管理)。这里的虚拟内存即所谓的swap。
  当用户提交程序,然后产生进程在机器上运行。机器会判断当前物理内存是否还有空闲允许进程调入内存运行,如果有则直接调入内存进行;如果没有,则会根据优先级选择一个进程挂起,把该进程交换到swap中等待,然后把新的进程调入到内存中运行。根据这种换入和换出,实现了内存的循环利用,让用户感觉不到内存的限制。从这也可以看出swap扮演了一个非常重要的角色,就是暂存被换出的进程。
  内存与swap之间是按照内存页为单位来交换数据的,一般Linux中页的大小设置为4Kb。而内存与磁盘则是按照来交换数据的。

Swap的设置

  从上可以看出,当物理内存使用完或者达到一定比例之后,我们可以使用swap做临时的内存使用。当物理内存和swap都被使用完那么就会出错,如:out of memory。
  对于使用多大比例内存之后开始使用swap,在系统配置文件中可以通过调整参数进行修改。 
1 [root@localhost ~]# cat /proc/sys/vm/swappiness
2 60
   该参数范围为0-100。0就是最大限度使用内存,尽量不使用swap;100是积极使用swap。
 
  物理内存无法更改,所以swap大小的设置将会影响应用能否正常运行。swap大小的确定,根据Centos官网介绍可以得出如下公式:
1 M = Amount of RAM in GB, and S = Amount of swap in GB, then If M < 2, S = M *2 Else S = M + 2
   注意:最小不应小于32M。
  
  Swap分区的数量对性能也有很大的影响。因为swap毕竟还是以磁盘来伪装成内存,交换的操作是磁盘IO的操作而不是内存的ioad与store操作。如果有多个swap交换区,每个swap会有一定的优先级,该优先级也可以调整。swap空间的分配会以轮流的方式操作于所有的swap,这样会大大均衡IO的负载,加快swap交换的速度。
Swap的创建和删除
1.创建swap分区
1.创建swap分区
命令: dd if=/dev/zero of=/swap bs=1M count=4096
说明:
if //输入
of //输出
bs //块儿大小
count //总大小
2.创建Linux交换文件
mkswap /swap
3. 立即激活交换文件
swapon /swap
通过free可以查看是否创建成功。
Image
2.如何删除呢?
首先停止swap分区
swapoff /swap
删除swap分区文件    
rm -rf /swap

Linux 命令-top

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。下面详细介绍它的使用方法。top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止该程序为止.比较准确的说,top命令提供了实时的对系统处理器的状态监视.它将显示系统中CPU最“敏感”的任务列表.该命令可以按CPU使用.内存使用和执行时间对任务进行排序;而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定.
1.命令格式:
top [参数]
2.命令功能:
显示当前系统正在执行的进程的相关信息,包括进程ID、内存占用率、CPU占用率等
3.命令参数:
-b 批处理
-c 显示完整的治命令
-I 忽略失效过程
-s 保密模式
-S 累积模式
-i<时间> 设置间隔时间
-u<用户名> 指定用户名
-p<进程号> 指定进程
-n<次数> 循环显示的次数
4.使用实例:
实例1:显示进程信息
命令:
top
输出:
top
说明:
统计信息区:
前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。

第一行,任务队列信息,同 uptime 命令的执行结果,具体参数说明情况如下:
14:06:23 — 当前系统时间
up 70 days, 16:44 — 系统已经运行了70天16小时44分钟(在这期间系统没有重启过的吆!)
2 users — 当前有2个用户登录系统
load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。
第二行,Tasks — 任务(进程),具体信息说明如下:
系统现在共有206个进程,其中处于运行中的有1个,205个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。
第三行,cpu状态信息,具体属性说明如下:
5.9%us — 用户空间占用CPU的百分比。
3.4% sy — 内核空间占用CPU的百分比。
0.0% ni — 改变过优先级的进程占用CPU的百分比
90.4% id — 空闲CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比
0.2% si — 软中断(Software Interrupts)占用CPU的百分比
第四行,内存状态,具体信息如下:
32949016k total — 物理内存总量(32GB)
14411180k used — 使用中的内存总量(14GB)
18537836k free — 空闲内存总量(18GB)
169884k buffers — 缓存的内存量 (169M)
第五行,swap交换分区信息,具体信息说明如下:
32764556k total — 交换区总量(32GB)
0k used — 使用的交换区总量(0K)
32764556k free — 空闲交换区总量(32GB)
3612636k cached — 缓冲的交换区总量(3.6GB)
备注:
第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。
如果出于习惯去计算可用内存数,这里有个近似的计算公式:第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存:18537836k +169884k +3612636k = 22GB左右。
对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。
第六行,空行。
第七行以下:各进程(任务)的状态监控,项目列信息说明如下:
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)

Hadoop_001 安装ssh

玩hadoop之前,必须安装ssh,确保所有的node之间是可以通过ssh连接的。
1. 什么是SSH

SSH 为 Secure Shell 的缩写,由 IETF 的网络小组(Network Working Group)所制定;SSH 为建立在应用层基础上的安全协议。SSH 是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议。利用 SSH 协议可以有效防止远程管理过程中的信息泄露问题。SSH最初是UNIX系统上的一个程序,后来又迅速扩展到其他操作平台。SSH在正确使用时可弥补网络中的漏洞。SSH客户端适用于多种平台。几乎所有UNIX平台—包括HP-UX、Linux、AIX、Solaris、Digital UNIX、Irix,以及其他平台,都可运行SSH

2. 安装SSH
[code]

sudo apt-get install openssh-server

[/code]
安装完成之后,通过下边命令,如果有ssh进程,就代表安装成功。
[code]
ps aux |grep ssh
[/code]

20180502224506

如果需要修改配置,可以修改/etc/ssh/sshd_config文件。

3. SSH无密码登录

常规的ssh需要输入密码的,如果不想输入密码,我们可以生成公钥和私钥,把自己的公钥部署在服务器上,这样下次登录就不需要输入密码了。网上相关的文章很多,可以参考下边的链接。

图解公钥与私钥
ssh免密码登录全过程