Overview

Namespaces

  • None
  • sinacloud
    • sae

Classes

  • SaeADPNS
  • SaeAPNS
  • SaeChannel
  • SaeDeferredJob
  • SaeFetchInternal
  • SaeKV
  • SaeMail
  • SaeMysql
  • SaeSegment
  • SaeTAdvance
  • SaeTaskQueue
  • SaeTClientV2
  • SaeTOAuthV2
  • SaeVCode
  • vDisk

Exceptions

  • OAuthException
  • Overview
  • Namespace
  • Class

Class SaeSegment

SAE 中文分词服务

<?php
$str = "明天星期天";
$seg = new SaeSegment();
$ret = $seg->segment($str, 1);

print_r($ret);  //输出

// 失败时输出错误码和错误信息
if ($ret === false)
        var_dump($seg->errno(), $seg->errmsg());
?>

错误码参考: - errno: 0 成功 - errno: -1 服务初始化出错,服务器没有正常启动 - errno: -2 错误的参数输入 - errno: -3 文本内容长度为0 - errno: -4 其他错误 - errno: 607 服务未初始化

SaeObject
Extended by SaeSegment
Package: sae
Author: Elmer Zhang
Located at saesegment.class.php
Methods summary
public
# __construct( )

构造对象

构造对象

public array|boolean
# segment( string $context, integer $word_tag = 0, string $encoding = 'UTF-8' )

执行分词

执行分词

Parameters

$context
需要分词的文本,目前限制文本大小最大为10KB。
$word_tag
用来标识返回的结果是否含有标注词性字段。0 表示不标注,1 表示标注词性,默认为0。(词性定义参见下面的常量)
$encoding
传入的文件编码格式:GB18030、UTF-8、UCS-2。默认为UTF-8

Returns

array|boolean
成功以数组格式返回分词结果,失败返回false.

Author

Elmer Zhang
public integer
# errno( )

取得错误码

取得错误码

Returns

integer

Author

Elmer Zhang
public string
# errmsg( )

取得错误信息

取得错误信息

Returns

string

Author

Elmer Zhang
Constants summary
integer POSTAG_ID_UNKNOW

不知道

不知道

# 0
integer POSTAG_ID_A

形容词

形容词

# 10
integer POSTAG_ID_B

区别词

区别词

# 20
integer POSTAG_ID_C

连词

连词

# 30
integer POSTAG_ID_C_N

体词连接

体词连接

# 31
integer POSTAG_ID_C_Z

分句连接

分句连接

# 32
integer POSTAG_ID_D

副词

副词

# 40
integer POSTAG_ID_D_B

副词("不")

副词("不")

# 41
integer POSTAG_ID_D_M

副词("没")

副词("没")

# 42
integer POSTAG_ID_E

叹词

叹词

# 50
integer POSTAG_ID_F

方位词

方位词

# 60
integer POSTAG_ID_F_S

方位短语(处所词+方位词)

方位短语(处所词+方位词)

# 61
integer POSTAG_ID_F_N

方位短语(名词+方位词“地上”)

方位短语(名词+方位词“地上”)

# 62
integer POSTAG_ID_F_V

方位短语(动词+方位词“取前”)

方位短语(动词+方位词“取前”)

# 63
integer POSTAG_ID_F_Z

方位短语(动词+方位词“取前”)

方位短语(动词+方位词“取前”)

# 64
integer POSTAG_ID_H

前接成分

前接成分

# 70
integer POSTAG_ID_H_M

数词前缀(“数”---数十)

数词前缀(“数”---数十)

# 71
integer POSTAG_ID_H_T

时间词前缀(“公元”“明永乐”)

时间词前缀(“公元”“明永乐”)

# 72
integer POSTAG_ID_H_NR

姓氏

姓氏

# 73
integer POSTAG_ID_H_N

姓氏

姓氏

# 74
integer POSTAG_ID_K

后接成分

后接成分

# 80
integer POSTAG_ID_K_M

数词后缀(“来”--,十来个)

数词后缀(“来”--,十来个)

# 81
integer POSTAG_ID_K_T

时间词后缀(“初”“末”“时”)

时间词后缀(“初”“末”“时”)

# 82
integer POSTAG_ID_K_N

名词后缀(“们”)

名词后缀(“们”)

# 83
integer POSTAG_ID_K_S

处所词后缀(“苑”“里”)

处所词后缀(“苑”“里”)

# 84
integer POSTAG_ID_K_Z

状态词后缀(“然”)

状态词后缀(“然”)

# 85
integer POSTAG_ID_K_NT

状态词后缀(“然”)

状态词后缀(“然”)

# 86
integer POSTAG_ID_K_NS

状态词后缀(“然”)

状态词后缀(“然”)

# 87
integer POSTAG_ID_M

数词

数词

# 90
integer POSTAG_ID_N

名词

名词

# 95
integer POSTAG_ID_N_RZ

人名(“毛泽东”)

人名(“毛泽东”)

# 96
integer POSTAG_ID_N_T

机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”)

机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”)

# 97
integer POSTAG_ID_N_TA
# 98
integer POSTAG_ID_N_TZ

机构团体名("北大")

机构团体名("北大")

# 99
integer POSTAG_ID_N_Z

其他专名(“专”的声母的第1个字母为z,名词代码n和z并在一起。)

其他专名(“专”的声母的第1个字母为z,名词代码n和z并在一起。)

# 100
integer POSTAG_ID_NS

名处词

名处词

# 101
integer POSTAG_ID_NS_Z

地名(名处词专指:“中国”)

地名(名处词专指:“中国”)

# 102
integer POSTAG_ID_N_M

n-m,数词开头的名词(三个学生)

n-m,数词开头的名词(三个学生)

# 103
integer POSTAG_ID_N_RB

n-rb,以区别词/代词开头的名词(该学校,该生)

n-rb,以区别词/代词开头的名词(该学校,该生)

# 104
integer POSTAG_ID_O

拟声词

拟声词

# 107
integer POSTAG_ID_P

介词

介词

# 108
integer POSTAG_ID_Q

量词

量词

# 110
integer POSTAG_ID_Q_V

动量词(“趟”“遍”)

动量词(“趟”“遍”)

# 111
integer POSTAG_ID_Q_T

时间量词(“年”“月”“期”)

时间量词(“年”“月”“期”)

# 112
integer POSTAG_ID_Q_H

货币量词(“元”“美元”“英镑”)

货币量词(“元”“美元”“英镑”)

# 113
integer POSTAG_ID_R

代词

代词

# 120
integer POSTAG_ID_R_D

副词性代词(“怎么”)

副词性代词(“怎么”)

# 121
integer POSTAG_ID_R_M

数词性代词(“多少”)

数词性代词(“多少”)

# 122
integer POSTAG_ID_R_N

名词性代词(“什么”“谁”)

名词性代词(“什么”“谁”)

# 123
integer POSTAG_ID_R_S

处所词性代词(“哪儿”)

处所词性代词(“哪儿”)

# 124
integer POSTAG_ID_R_T

时间词性代词(“何时”)

时间词性代词(“何时”)

# 125
integer POSTAG_ID_R_Z

谓词性代词(“怎么样”)

谓词性代词(“怎么样”)

# 126
integer POSTAG_ID_R_B

区别词性代词(“某”“每”)

区别词性代词(“某”“每”)

# 127
integer POSTAG_ID_S

处所词(取英语space的第1个字母。“东部”)

处所词(取英语space的第1个字母。“东部”)

# 130
integer POSTAG_ID_S_Z

处所词(取英语space的第1个字母。“东部”)

处所词(取英语space的第1个字母。“东部”)

# 131
integer POSTAG_ID_T

时间词(取英语time的第1个字母)

时间词(取英语time的第1个字母)

# 132
integer POSTAG_ID_T_Z

时间专指(“唐代”“西周”)

时间专指(“唐代”“西周”)

# 133
integer POSTAG_ID_U

助词

助词

# 140
integer POSTAG_ID_U_N

定语助词(“的”)

定语助词(“的”)

# 141
integer POSTAG_ID_U_D

状语助词(“地”)

状语助词(“地”)

# 142
integer POSTAG_ID_U_C

补语助词(“得”)

补语助词(“得”)

# 143
integer POSTAG_ID_U_Z

谓词后助词(“了、着、过”)

谓词后助词(“了、着、过”)

# 144
integer POSTAG_ID_U_S

体词后助词(“等、等等”)

体词后助词(“等、等等”)

# 145
integer POSTAG_ID_U_SO

助词(“所”)

助词(“所”)

# 146
integer POSTAG_ID_W

标点符号

标点符号

# 150
integer POSTAG_ID_W_D

顿号(“、”)

顿号(“、”)

# 151
integer POSTAG_ID_W_SP

句号(“。”)

句号(“。”)

# 152
integer POSTAG_ID_W_S

分句尾标点(“,”“;”)

分句尾标点(“,”“;”)

# 153
integer POSTAG_ID_W_L

搭配型标点左部

搭配型标点左部

# 154
integer POSTAG_ID_W_R

搭配型标点右部(“》”“]”“)”)

搭配型标点右部(“》”“]”“)”)

# 155
integer POSTAG_ID_W_H

中缀型符号

中缀型符号

# 156
integer POSTAG_ID_Y

语气词(取汉字“语”的声母。“吗”“吧”“啦”)

语气词(取汉字“语”的声母。“吗”“吧”“啦”)

# 160
integer POSTAG_ID_V

及物动词(取英语动词verb的第一个字母。)

及物动词(取英语动词verb的第一个字母。)

# 170
integer POSTAG_ID_V_O

不及物谓词(谓宾结构“剃头”)

不及物谓词(谓宾结构“剃头”)

# 171
integer POSTAG_ID_V_E

动补结构动词(“取出”“放到”)

动补结构动词(“取出”“放到”)

# 172
integer POSTAG_ID_V_SH

动词“是”

动词“是”

# 173
integer POSTAG_ID_V_YO

动词“有”

动词“有”

# 174
integer POSTAG_ID_V_Q

趋向动词(“来”“去”“进来”)

趋向动词(“来”“去”“进来”)

# 175
integer POSTAG_ID_V_A

助动词(“应该”“能够”)

助动词(“应该”“能够”)

# 176
integer POSTAG_ID_Z

状态词(不及物动词,v-o、sp之外的不及物动词)

状态词(不及物动词,v-o、sp之外的不及物动词)

# 180
integer POSTAG_ID_X

语素字

语素字

# 190
integer POSTAG_ID_X_N

名词语素(“琥”)

名词语素(“琥”)

# 191
integer POSTAG_ID_X_V

动词语素(“酹”)

动词语素(“酹”)

# 192
integer POSTAG_ID_X_S

处所词语素(“中”“日”“美”)

处所词语素(“中”“日”“美”)

# 193
integer POSTAG_ID_X_T

时间词语素(“唐”“宋”“元”)

时间词语素(“唐”“宋”“元”)

# 194
integer POSTAG_ID_X_Z

状态词语素(“伟”“芳”)

状态词语素(“伟”“芳”)

# 195
integer POSTAG_ID_X_B

状态词语素(“伟”“芳”)

状态词语素(“伟”“芳”)

# 196
integer POSTAG_ID_SP

不及物谓词(主谓结构“腰酸”“头疼”)

不及物谓词(主谓结构“腰酸”“头疼”)

# 200
integer POSTAG_ID_MQ

数量短语(“叁个”)

数量短语(“叁个”)

# 201
integer POSTAG_ID_RQ

代量短语(“这个”)

代量短语(“这个”)

# 202
integer POSTAG_ID_AD

副形词(直接作状语的形容词)

副形词(直接作状语的形容词)

# 210
integer POSTAG_ID_AN

名形词(具有名词功能的形容词)

名形词(具有名词功能的形容词)

# 211
integer POSTAG_ID_VD

副动词(直接作状语的动词)

副动词(直接作状语的动词)

# 212
integer POSTAG_ID_VN

名动词(指具有名词功能的动词)

名动词(指具有名词功能的动词)

# 213
integer POSTAG_ID_SPACE

空格

空格

# 230
API documentation generated by ApiGen