php中的(多线程)curl批量处理

function getMultiUrls($urls, $timeout = 30)
	{
		$queue = curl_multi_init();
		$map = array();
	
		foreach($urls as $id=>$url)
		{
			$ch = curl_init();
			curl_setopt($ch , CURLOPT_URL , $url);
			curl_setopt($ch , CURLOPT_TIMEOUT , $timeout);
			curl_setopt($ch , CURLOPT_RETURNTRANSFER , 1);
 			curl_setopt($ch, CURLOPT_HEADER, true);
// 			curl_setopt($ch , CURLOPT_HEADER , 0);
			curl_setopt($ch, CURLOPT_NOBODY, true);
			curl_setopt($ch , CURLOPT_NOSIGNAL , true);
	
			curl_multi_add_handle($queue , $ch);
			$map[(string) $ch] = $id;
		}
	
		$responses = array();
		do
		{
			while(($code = curl_multi_exec($queue , $active)) == CURLM_CALL_MULTI_PERFORM);
			if($code != CURLM_OK)
			{
				break;
			}
	
			// a request was just completed -- find out which one
			while($done = curl_multi_info_read($queue))
			{
	
				// get the info and content returned on the request
				$content = curl_multi_getcontent($done['handle']);
	
				$responses[$map[(string) $done['handle']]] = $this->parseHead($content);
	
				// remove the curl handle that just completed
				curl_multi_remove_handle($queue , $done['handle']);
				curl_close($done['handle']);
			}
	
			// Block for data in / output; error handling is done by
			// curl_multi_exec
			if($active > 0)
			{
				curl_multi_select($queue , 0.5);
			}
		}
		while($active);
		curl_multi_close($queue);
		return $responses;
	}
	
	function parseHead($headSream)
	{
		$headArrayTemp = explode("\r\n", $headSream);
		foreach ($headArrayTemp as $k=>$v)
		{
			if ($k==0)
			{
				$httpstas = explode(" ",$v);
				$headArray["http-edition"] = trim($httpstas[0]);
				$headArray["http-state"] = trim($httpstas[1]);
				$headArray["http-describe"] = "";
				for($i=2;$i<count($httpstas);$i++){
						$headArray["http-describe"] .= " ".trim($httpstas[$i]);
				}
			}
			else
			{
				if ($v == '')
				{
					break;
				}
				$headArray[strtolower(substr($v, 0, strpos($v, ':')))] = substr($v,strpos($v, ':')+1);
			}
		}
		
		return $headArray;
	}

CentOS下搭建SVN服务端

安装

yum install subversion

新建目录

mkdir -p /home/svn

新建项目

svnadmin create /home/svn/test

编辑配置文件
1. /home/svn/test/conf/svnserve.conf
将下列去掉注释:
anon-access = none
auth-access = write
password-db = passwd
authz-db = authz

realm = test

 

2. /home/svn/test/conf/passwd 添加账号密码

3. /home/svn/test/conf/authz 添加账号认证

具体案例看文章最后的附录

启动svnserver

/usr/bin/svnserve -d -r /home/svn/

加入到启动项

echo /usr/bin/svnserve -d -r /home/svn/ >> /etc/rc.d/rc.local

修改密码、添加新项目等都不需要重启svn进程;
上述test项目的默认svn地址为: svn://xxx.xxx.xxx/test (其中xxx.xxx.xxx为服务器ip)

附录:
svnserve.conf

### This file controls the configuration of the svnserve daemon, if you
### use it to allow access to this repository.  (If you only allow
### access through http: and/or file: URLs, then this file is
### irrelevant.)

### Visit http://subversion.tigris.org/ for more information.

[general]
### These options control access to the repository for unauthenticated
### and authenticated users.  Valid values are "write", "read",
### and "none".  The sample settings below are the defaults.
anon-access = none
auth-access = write
### The password-db option controls the location of the password
### database file.  Unless you specify a path starting with a /,
### the file's location is relative to the conf directory.
### Uncomment the line below to use the default password file.
password-db = passwd
### The authz-db option controls the location of the authorization
### rules for path-based access control.  Unless you specify a path
### starting with a /, the file's location is relative to the conf
### directory.  If you don't specify an authz-db, no path-based access
### control is done.
### Uncomment the line below to use the default authorization file.
authz-db = authz
### This option specifies the authentication realm of the repository.
### If two repositories have the same authentication realm, they should
### have the same password database, and vice versa.  The default realm
### is repository's uuid.
# realm = My First Repository

pass

### This file is an example password file for svnserve.
### Its format is similar to that of svnserve.conf. As shown in the
### example below it contains one section labelled [users].
### The name and password for each user follow, one account per line.

[users]
# harry = harryssecret
# sally = sallyssecret

root  = xxxxx

authz

### This file is an example authorization file for svnserve.
### Its format is identical to that of mod_authz_svn authorization
### files.
### As shown below each section defines authorizations for the path and
### (optional) repository specified by the section name.
### The authorizations follow. An authorization line can refer to a
### single user, to a group of users defined in a special [groups]
### section, or to anyone using the '*' wildcard.  Each definition can
### grant read ('r') access, read-write ('rw') access, or no access
### ('').

[groups]
# harry_and_sally = harry,sally

# [/foo/bar]
# harry = rw
# * =

# [repository:/baz/fuz]
# @harry_and_sally = rw
# * = r

[/]
root = rw

(r表示可读,w表示可写)

详解mysql数据库sql_mode模式

mysql可以运行在不同sql mode模式下面,sql mode模式定义了mysql应该支持的sql语法,数据校验等!

查看默认的sql mode模式:
select @@sql_mode;
我的数据库是:
STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
在此模式下面,如果插入的数据的长度大于定义的长度,那么就会报错!

set session sql_mode=’REAL_AS_FLOAT,PIPES_AS_CONCAT,ANSI_QUOTES,IGNORE_SPACE,ANSI’;
在这种模式下面:插入的数据的长度大于定义的时候,就会截取,并警告,但是可以插入进去
session表示只在本次中有效
global:表示在本次连接中不生效,而对于新的连接就生效

启用NO_BACKSLASH_ESCAPES模式,使反斜线成为普通字符,在导入数据时候,如果数据中有反斜线,启用这个模式是个不错的选择

启用PIPES_AS_CNCAT模式,将||看成是普通字符串

常用的sql mode:
sql mode值 说明
ANSI: ‘REAL_AS_FLOAT,PIPES_AS_CONCAT,ANSI_QUOTES,IGNORE_SPACE和ANSI组合’,这种模式使语法和行为更符合标准的sql
STRICT_TRANS_TABLES : 使用与事务和非事务表,严格模式
TRADITIONAL :也是严格模式,对于插入不正确的值给出错误而不是警告。用在事务时,只要发生错误就立即回滚

在Mysql5.0以下,默认的sql mode(sql mode参数)有:real_as_float,pipes_as_concat,ansi_quotes,gnore_space和ANSI。在这些模式下可以插入超过字段定义长度的数据,或是在字段中没有定义的元素数据(如,enum)。不过在插入后会有一个warning(可以用 show warnings来查看)。
在Mysql5.0以上版本中,有三种sql mode模式(ANSI、TRADITIONAL和STRICT_TRANS_TABLES(严格模式))可以用来解决以下问题:
(1). 通过设置不同的sql mode,可以在不同严格程序进行数据校验,有效地保证了数据准确性.
(2).通过设置sql mode为ANSI模式,来保证大多数SQL符合标准SQL的语法,这样在不同数据库之间迁移时,不需要对业务修改太多.
通过设置sql mode为STRICT_TRANS_TABLES(严格模式)来实现数据的严格校检,使错误数据不能插入,从而保证数据准确性。TRADITIONAL 模式也属于严格模式,同样可以实现严格校检,使错误数据不能插入,从而保证数据准确性。不过在这种模式MAX(X,0)返回的结果是NULL,所以在包含有MAX的运算中根据实际情况设定好sql mode.
ENUM是一个字符串对象,其值来自表创建时在列规定中显式枚举的一列值。在某些情况下,ENUM值也可以为空字符串(”)或NULL:如果你将一个非法值插入ENUM(也就是说,允许的值列之外的字符串),将插入空字符串以作为特殊错误值。该字符串与“普通” 空字符串不同,该字符串有数值值0。
如果将ENUM列声明为允许NULL,NULL值则为该列的一个有效值,并且 默认值为NULL。如果ENUM列被声明为NOT NULL,其默认值为允许的值列的第1个元素。
(1)sql mode为ANSI

mysql> create table test(id bigint(20) auto_increment primary key, browsertype enum('ie','firefox','other')); 
mysql> insert into test(browsertype) values('ie') ; 
Query OK, 1 row affected (0.07 sec) 
mysql> insert into test(browsertype) values('maxthon') ; 
Query OK, 1 row affected (0.03 sec) 
mysql> show warnings;(数据虽然成功insert,但有warning) 
+---------+------+--------------------------------------------------+ 
| Level | Code | Message | 
+---------+------+--------------------------------------------------+ 
| Warning | 1265 | Data truncated for column 'browsertype' at row 1 | 
+---------+------+--------------------------------------------------+ 
1 row in set (0.01 sec) 
mysql> select * from test; 
+----+-------------+ 
| id | browsertype | 
+----+-------------+ 
| 1 | ie | 
| 2 | | 
+----+-------------+ 
2 rows in set (0.01 sec)

(2)使用严格模式(STRICT_TRANS_TABLES)

mysql> set session sql_mode='STRICT_TRANS_TABLES'; 
Query OK, 0 rows affected (0.00 sec) 
mysql> select @@sql_mode; 
+---------------------+ 
| @@sql_mode | 
+---------------------+ 
| STRICT_TRANS_TABLES | 
+---------------------+ 
1 row in set (0.00 sec) 
mysql> insert into test(browsertype) values('maxthon') ; 
ERROR 1265: Data truncated for column 'browsertype' at row 1 

mysql> insert into test(browsertype) values('firefox') ; 
Query OK, 1 row affected (0.00 sec) 
mysql> select * from test; 
+----+-------------+ 
| id | browsertype | 
+----+-------------+ 
| 1 | ie | 
| 2 | | 
| 3 | firefox | 
+----+-------------+ 
3 rows in set (0.00 sec)

(3) TRADITIONAL模式

mysql> create table t11 (i int); 
Query OK, 0 rows affected (0.02 sec) 
mysql> set sql_mode='ANSI'; 
Query OK, 0 rows affected (0.00 sec) 
mysql> insert into t11 values(9%0); 
Query OK, 1 row affected (0.00 sec) 
mysql> select * from t11; 
+------+ 
| i | 
+------+ 
| NULL | 
+------+ 
1 row in set (0.00 sec) 
mysql> set sql_mode='TRADITIONAL'; 
Query OK, 0 rows affected (0.00 sec) 
mysql> insert into t11 values(9%0); 
ERROR 1365: Division by 0 
mysql> show warnings; 
+-------+------+---------------+ 
| Level | Code | Message | 
+-------+------+---------------+ 
| Error | 1365 | Division by 0 | 
+-------+------+---------------+ 
1 row in set (0.02 sec)

 

正则中的一些特殊字母

i 匹配大小写

s 模式中的圆点元字符(.)匹配所有的字符,包括换行符

x 模式中的空白字符除了被转义的或在字符类中的以外完全被忽略,在未转义的字符类之外的 # 以及下一个换行符之间的所有字符,包括两 头,也都被忽略

A (PCRE_ANCHORED) 如果设定了此修正符,模式被强制为“anchored”,即强制仅从目标字符串的开头开始匹配即自动在模式开头加上^。

D (PCRE_DOLLAR_ENDONLY) 如果设定了此修正符,模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时,如果最后一个字符是换行符的话,美元符号也会匹配此字符之前(但不会匹配 任何其它换行符之前)。如果设定了 m 修正符则忽略此选项。Perl 中没有与其等价的修正符。  S 当一个模式将被使用若干次时,为加速匹配起见值得先对其进行分析。如果设定了此修正符则会进行额外的分析。目前,分析一个模式仅对没有单一固定起始字符的 non-anchored 模式有用。

U (PCRE_UNGREEDY) 本修正符反转了匹配数量的值使其不是默认的重复,而变成在后面跟上“?”才变得重复。这和 Perl 不兼容。也可以通过在模式之中设定 (?U) 修正符来启用此选项。

X (PCRE_EXTRA) 此 修正符启用了一个 PCRE 中与 Perl 不兼容的额外功能。模式中的任何反斜线后面跟上一个没有特殊意义的字母导致一个错误,从而保留此组合以备将 来扩充。默认情况下,和 Perl 一样,一个反斜线后面跟一个没有特殊意义的字母被当成该字母本身。当前没有其它特性受此修正符控制。即:贪婪模式,最 大限度匹配 如:/a[\w]+?e/U匹配abceadeddd中的abceade而不是abce,如果不加U修正,则匹配abce  u (PCRE_UTF8) 此修正符启用了一个 PCRE 中与 Perl 不兼容的额外功能。模式字符串被当成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。

PV、UV、IP都代表什么

在网络营销实践中经常会用到网站统计工具,这里边的PV、UV、IP值都代表什么呢,下面做详细的说明。
先说下PV、UV、IP的定义:
PV(访问量):Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。
UV(独立访客):Unique Visitor,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只会被计算一次。
IP(独立IP):指独立IP数。00:00-24:00内相同IP地址之被计算一次。
再谈下PV、UV、IP的区别:
IP(独立IP)表示,拥有特定唯一IP地址的计算机访问您的网站的次数,因为这种统计方式比较容易实现,具有较高的真实性,所以成为大多数机构衡量网站流量的 重要指标。比方你是ADSL拨号上网的,你拨一次号都自动分配一个IP,这样你进入了本站,那就算一个IP,当你断线了而没清理Cookies,之后又拨 了一次号,又自动分配到一个IP,你再进来了本站,那么又统计到一个IP,这时统计数据里IP就显示统计了2次。但是UV(独立访客)没有变,因为两次都 是你进入了本站。
来说明一下PV高不一定代表来访者多;PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量。比如一个网站就你一个人进来,通过不断的刷新页面,也可以制造出非常高的PV。
再来说说UV:IP在这里是指公用的广域网传输协议族(Tcp/Ip)为每一台处在因特网上的计算机(可以是个人电脑、服务器以及其他兼容广域网传输 协议族规定的 接入设备)都定义了四个段落(例如:192.168.0.255形式,有时会加入第五段落端口号作为描述信息,端口号是介于1-65535 之间的数字)共 32位长度二进制代码的标识,叫IP协议地址,简称IP地址,俗称IP,它是一个一台连接着广域网的计算机区别于其他机器的标识,一般情 况下,它在同一级别的网络(例如某个局域网、社区网、教学楼网或者INTERNET)范围内是唯一的。
UV是指不同的、通过互联网访问、浏览一个网页的自然人。
比如,在一台电脑上,哥哥打开了微软的官方主页,注册了一个会员。弟弟一会儿也看了看,注册了另一个会员。由于兄弟两个使用的是相同的计算机,那么他 们的 IP是一样的,微软的官方计数器记录到一个IP登陆的信息。但是,具有统计功能的统计系统,可以根据其他条件判断出实际使用的用户数量,返回给网站 建设者真实、可信和准确的信息。比如通过注册的用户,甚至可以区分出网吧、机房等共享一个IP地址的不同计算机。上面的例子就说明虽然是同一IP,但是有 2个独立访客。再举个例子吧,比如一个网吧里,有100个人都进入了我的网站,但是一个网吧对外都是一个IP的,所以统计系统只统计到一个IP;但是因为 网吧里有100人在访问我的站,尽管他们都仅仅打开我的网站的首页,或者这100人都把我网站所有页面都看过了一遍,统计系统都只统计到100个独立访 客。
使用独立用户作为统计量有什么好处?它比IP更加准确吗?
IP是一个反映网络虚拟地址对象的概念,UV是一个反映实际使用者的概念,每个UV相对于每个IP更加准确地对应一个实际的浏览者。
综上所述:使用UV作为统计量,可以更加准确的了解单位时间内实际上有多少个访问者来到了相应的页面。

mysql中order by field的使用

SELECT * FROM fruit 
ORDER BY FIELD(name, 'Banana', 'Apple', 'Pear', 'Orange'), variety;
+----------+--------+---------------------+
| fruit_id | name   | variety             |
+----------+--------+---------------------+
|       11 | Banana | Burro               |
|       12 | Banana | Cavendish           |
|       10 | Banana | Plantain            |
|        6 | Apple  | Cox's Orange Pippin |
|        7 | Apple  | Granny Smith        |
|        1 | Apple  | Red Delicious       |
|        8 | Pear   | Anjou               |
|        4 | Pear   | Bartlett            |
|        2 | Pear   | Comice              |
|        5 | Orange | Blood               |
|        3 | Orange | Navel               |
|        9 | Orange | Valencia            |
+----------+--------+---------------------+
SELECT * FROM fruit
ORDER BY FIELD(name, 'Banana', 'Apple') DESC, variety;
+----------+--------+---------------------+
| fruit_id | name   | variety             |
+----------+--------+---------------------+
|        6 | Apple  | Cox's Orange Pippin |
|        7 | Apple  | Granny Smith        |
|        1 | Apple  | Red Delicious       |
|       11 | Banana | Burro               |
|       12 | Banana | Cavendish           |
|       10 | Banana | Plantain            |
|        8 | Pear   | Anjou               |
|        4 | Pear   | Bartlett            |
|        5 | Orange | Blood               |
|        2 | Pear   | Comice              |
|        3 | Orange | Navel               |
|        9 | Orange | Valencia            |
+----------+--------+---------------------+
SELECT * FROM fruit
ORDER BY FIELD(name, 'Apple', 'Banana') DESC, name, variety;
+----------+--------+---------------------+
| fruit_id | name   | variety             |
+----------+--------+---------------------+
|       11 | Banana | Burro               |
|       12 | Banana | Cavendish           |
|       10 | Banana | Plantain            |
|        6 | Apple  | Cox's Orange Pippin |
|        7 | Apple  | Granny Smith        |
|        1 | Apple  | Red Delicious       |
|        5 | Orange | Blood               |
|        3 | Orange | Navel               |
|        9 | Orange | Valencia            |
|        8 | Pear   | Anjou               |
|        4 | Pear   | Bartlett            |
|        2 | Pear   | Comice              |
+----------+--------+---------------------+

vps开通最低权限的ssh用于科学上网

vps增加SSH账号用来代理上网,即开通没有shell权限的SSH帐号的方法:(说明:此账号没有SSH登陆权限)

useradd -M -s /sbin/nologin -n username # 说明,username表示开通的ssh账号
userdel -r username # 删除用户
passwd username # 修改用户密码

操作实例演示:
比如要添加用户名为 SSH001 的账号,账号密码为:123 可以进行如下操作:
首先以root身份登录vps

[root@hc] useradd -M -s /sbin/nologin -n ssh001
[root@hc] passwd ssh001
Changing password for user ssh001
New UNIX password:123 # 实际操作中,这里的密码是不会显示的
Retype new UNIX password:123 # 实际操作中,这里的密码是不会显示的
passwd: all authenication tokens updated successfully.

注意:当你输入密码时,屏幕是没有任何字符显示的,系统会让你输入两次密码,来确认是否一致。
当出现最后一行的提示时,说明密码修改成功

[来源]

php中关于date中的周次

for ($i = 1990; $i <= 2025; $i++) {
	echo $i . '年第一天是星期' . date('w', strtotime($i . '-01-01')) . '====第'  . date('W', strtotime($i . '-01-01')) . '周&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' . $i . '年最后一天是星期' . date('w', strtotime($i . '-12-31')) . '====第'  . date('W', strtotime($i . '-12-31')) . '周<br />';
}

clipboard

 

可以看到:
                年初的时候,如果第一天是周1,周2,周3,周4这几天,那么用date(‘W’,time())会解析出是这年的第一周
                                     如果第一天是周5,周6,周日这几天,那么用date(‘W’,time())会解析出是上一年的最后一周
                年末的时候,如果最后一天是周1,周2,周3这几天,那么用date(‘W’,time())会解析出是下一年的第一周
                                     如果 最后一天是周4周5,周6,周日这几天,那么用date(‘W’,time())会解析出是这年的最后一周

php匹配汉字的正则表达式,utf-8编码和gbk编码

/^[\x{4e00}-\x{9fa5}]+$/u

以上这个正则表达式就是困扰了很多php程序员的匹配汉字的正则表达式

大家可能会觉得很简单,实际上不同编码,不同程序语言,都有些细微的出入,稍不注意就得不到正确的结果。
下面是utf-8编码的例子:
程序语言为php
$str = "MyBB中文站";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

下面的例子包含gbk,gb2312的用法,需要的可以取消gbk那行的注释,然后把utf-8的注释掉

<?php
$action = trim($_GET['action']);
if($action == "sub")
{
    $str = $_POST['dir'];    
    //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式 
    if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))   //UTF-8汉字字母数字下划线正则表达式
    {   
        echo "<font color=red>您输入的[".$str."]含有违法字符</font>";   
    }
    else 
    {
        echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>";   
    }
}
?>
<form method="POST" action="?action=sub">
输入字符(数字,字母,汉字,下划线):
    <input type="text" name="dir" value="">
    <input type="submit" value="提交">
</form>

具体如何得出这个正则表达式的,可以参考原文:http://www.diybl.com/course/4_webprogram/php/phpjs/20090302/156831.html

JS操作DOM元素属性和方法

        W3C DOM和JavaScript很容易混淆不清。DOM是面向HTML和XML文档的API,为文档提供了结构化表示,并定义了如何通过脚本来访问文档结构。JavaScript则是用于访问和处理DOM的语言。如果没有DOM,JavaScript根本没有Web页面和构成页面元素的概念。文档中的每个元素都是DOM的一部分,这就使得JavaScript可以访问元素的属性和方法。

DOM独立于具体的编程语言,通常通过JavaScript访问DOM,不过并不严格要求这样。可以使用任何脚本语言来访问DOM,这要归功于其一致的API。表3-1列出了DOM元素的一些有用的属性,表3-2列出了一些有用的方法。

表3-1 用于处理XML文档的DOM元素属性

属性名         描述
childNodes 返回当前元素所子有元素的数组

firstChild 返回当前元素的第一个下级子元素

lastChild 返回当前元素的最后一个子元素
nextSibling 返回紧跟在当前元素后面的元素
nodeValue 指定表示元素值的读/写属性
parentNode 返回元素的父节点
previousSibling 返回紧邻当前元素之前的元素
表3-2 用于遍历XML文档的DOM元素方法
方法名                         描述
getElementById(id) (document) 获取有指定惟一ID属性值文档中的元素
getElementsByTagName(name) 返回当前元素中有指定标记名的子元素的数组
hasChildNodes() 返回一个布尔值,指示元素是否有子元素
getAttribute(name) 返回元素的属性值,属性由name指定
  有了W3C DOM,就能编写简单的跨浏览器脚本,从而充分利用XML的强大功能和灵活性,将XML作为浏览器和服务器之间的通信介质。
  从下面的例子可以看到,使用遵循W3C DOM的JavaScript来读取XML文档是何等简单。代码清单3-3显示了服务器向浏览器返回的XML文档的内容。这是一个简单的美国州名列表,各个州按地区划分。
表3-3 动态创建内容时所用的W3C DOM属性和方法
属性/方法                  描述
document.createElement(tagName) 文档对象上的createElement方法可以创建由tagName指定的元素。如果以串div作为方法参数,就会生成一个div元素
document.createTextNode(text) 文档对象的createTextNode方法会创建一个包含静态文本的节点
<element>.appendChild(childNode) appendChild方法将指定的节点增加到当前元素的子节点列表(作为一个新的子节点)。例如,可以增加一个option元素,作为select元素的子节点
<element>.getAttribute(name)
<element>.setAttribute(name, value)这些方法分别获得和设置元素中name属性的值
<element>.insertBefore(newNode, targetNode)将节点newNode作为当前元素的子节点插到targetNode元素前面
<element>.removeAttribute(name) 这个方法从元素中删除属性name
<element>.removeChild(childNode) 这个方法从元素中删除子元素childNode
<element>.replaceChild(newNode, oldNode) 这个方法将节点oldNode替换为节点newNode
<element>.hasChildnodes() 这个方法返回一个布尔值,指示元素是否有子元素
Document--最顶层的节点,所有的其他节点都是附属于它的。
DocumentType--DTD引用(使用<!DOCTYPE>语法)的对象表现形式,它不能包含子节点。
DocumentFragment--可以像Document一样来保存其他节点。
Element--表示起始标签和结束标签之间的内容,例如<tag></tab>或者<tag/>。这是唯一可以同时包含特性和子节点的节点类型。
Attr--代表一对特性名和特性值。这个节点类型不能包含子节点。
Text--代表XML文档中的在起始标签和结束标签之间,或者CDataSection内包含的普通文本。这个节点类型不能包含子节点。
CDataSection--<![CDATA[]]>的对象表现形式。这个节点类型仅能包含文本节点Text作为子节点。
Entity--表示在DTD中的一个实体定义,例如<!ENTITY foo”foo”>。这个节点类型不能包含子节点。
EntityReference--代表一个实体引用,例如&quot;。这个节点类型不能包含子节点。
ProcessingInstruction--代表一个PI。这个节点类型不能包含子节点。
Comment--代表XML注释。这个节点不能包含子节点。
Notation--代表在DTD中定义的记号。这个很少用到。
Node接口定义了所有节点类型都包含的特性和方法。
特性/方法 类型/返回类型 说明
nodeName String 节点的名字;根据节点的类型而定义
nodeValue String 节点的值;根据节点的类型而定义
nodeType Number 节点的类型常量值之一
ownerDocument Document 指向这个节点所属的文档
firstChild Node 指向在childNodes列表中的第一个节点
lastChild Node 指向在childNodes列表中的最后一个节点
childNodes NodeList 所有子节点的列表
previousSibling Node 指向前一个兄弟节点;如果这个节点就是第一个兄弟节点,那么该值为null
nextSibling Node 指向后一个兄弟节点;如果这个节点就是最后一个兄弟节点,那么该值为null
hasChildNodes() Boolean 当childNodes包含一个或多个节点时,返回真
attributes NamedNodeMap 包含了代表一个元素的特性的Attr对象;仅用于Element节点
appendChild(node) Node 将node添加到childNodes的末尾
removeChild(node) Node 从childNodes中删除node
replaceChild(newnode,oldnode) Node 将childNodes中的oldnode替换成newnode
insertBefore(newnode,refnode) Node 在childNodes中的refnode之前插入newnodd
除节点外,DOM还定义了一些助手对象,它们可以和节点一起使用,但不是DOM文档必有的部分。
NodeList--节点数组,按照数值进行索引;用来表示和一个元素的子节点。
NamedNodeMap--同时使用数值和名字进行索引的节点表;用于表示元素特性。
2.访问相关的节点
下面的几节中考虑下面的HTML页面
1<html>
2    <head>
3        <title>DOM Example</title>
4    </head>
5    <body>
6        <p>Hello World!</p>
7        <p>Isn’t this exciting?</p>
8        <p>You’re learning to use the DOM!</p>
9    </body>
10</html>
要访问<html/>元素(你应该明白这是该文件的document元素),你可以使用document的documentElement特性:
var oHtml = document.documentElement;
现在变量oHtml包含一个表示<html/>的HTMLElement对象。如果你想取得<head/>和<body/>元素,下面的可以实现:
var oHead = oHtml.firstChild;
var oBody = oHtml.lastChild;
也可以使用childNodes特性来完成同样的工作。只需把它当成普通的javascript array,使用方括号标记:
var oHead = oHtml.childNodes[0];
var oBody = oHtml.childNodes[1];
注意方括号标记其实是NodeList在javascript中的简便实现。实际上正式的从childNodes列表中获取子节点的方法是使用item()方法:
var oHead = oHtml.childNodes.item(0);
var oBody = oHtml.childNodes.item(1);
HTML DOM页定义了document.body作为指向<body/>元素的指针。
var oBody = ducument.body;
有了oHtml,oHead和oBody这三个变量,就可以尝试确定它们之间的关系:
alert(oHead.parentNode==oHtml);
alert(oBody.parentNode==oHtml);
alert(oBody.previousSibling==oHead);
alert(bHead.nextSibling==oBody);
alert(oHead.ownerDocument==document);
以上均outputs “true”。
3.处理特性
正如前面所提到的,即便Node接口已具有attributes方法,且已被所有类型的节点继承,然而,只有
Element节点才能有特性。Element节点的attributes属性其实是NameNodeMap,它提供一些用于访问和处理其内容的方法:
getNamedItem(name)--返回nodename属性值等于name的节点;
removeNamedItem(name)--删除nodename属性值等于name的节点;
setNamedItem(node)--将node添加到列表中,按其nodeName属性进行索引;
item(pos)--像NodeList一样,返回在位置pos的节点;
注:请记住这些方法都是返回一个Attr节点,而非特性值。
NamedNodeMap对象也有一个length属性来指示它所包含的节点的数量。
当NamedNodeMap用于表示特性时,其中每个节点都是Attr节点,这的nodeName属性被设置为特性名称,而nodeValue属性被设置为特性的值。例如,假设有这样一个元素:
<p style=”color:red” id=”p1″>Hello world!</p>
同时,假设变量oP包含指向这个元素的一个引用。于是可以这样访问id特性的值:
var sId = oP.attributes.getNamedItem(“id”).nodeValue;
当然,还可以用数值方式访问id特性,但这样稍微有些不直观:
var sId = oP.attributes.item(1).nodeValue;
还可以通过给nodeValue属性赋新值来改变id特性:
oP.attributes.getNamedItem(“id”).nodeValue=”newId”;
Attr节点也有一个完全等同于(同时也完全同步于)nodeValue属性的value属性,并且有name属性和nodeName属性保持同步。我们可以随意使用这些属性来修改或变更特性。
因为这个方法有些累赘,DOM又定义了三个元素方法来帮助访问特性:
getAttribute(name)--等于attributes.getNamedItem(name).value;
setAttribute(name,newvalue)--等于attribute.getNamedItem(name).value=newvalue;
removeAttribute(name)--等于attribute.removeNamedItem(name)。
4.访问指定节点
(1)getElementsByTagName()
核 心(XML) DOM定义了getElementsByTagName()方法,用来返回一个包含所有的tagName(标签名)特性等于某个指定值的元素的 NodeList。在Element对象中,tagName特性总是等于小于号之后紧跟随的名称--例如,<img />的tagName是”img”。下一行代码返回文档中所有<img />元素的列表:
var oImgs = document.getElementsByTagName(“img”);
把所有图形都存于oImgs后,只需使用方括号或者Item()方法(getElementsByTagName()返回一个和childNodes一样的NodeList),就可以像访问子节点那样逐个访问这些节点了:
alert(oImgs[0].tagName);      //outputs “IMG”
假如只想获取在某个页面第一个段落的所有图像,可以通过对第一个段落元素调用getElementsByTagName()来完成,像这样:
var oPs = document.getElementByTagName(“p”);
var oImgsInp = oPs[0].getElementByTagName(“img”);
可以使用一个星号的方法来获取document中的所有元素:
var oAllElements = document.getElementsByTagName(“*”);
当参数是一个星号的时候,IE6.0并不返回所有的元素。必须使用document.all来替代它。
(2)getElementsByName()
HTML DOM 定义了getElementsByName(),这用来获取所有name特性等于指定值的元素的。
(3)getElementById()
这是HTML DOM定义的第二种方法,它将返回id特性等于指定值的元素。在HTML中,id特性是唯一的--这意味着没有两个元素可以共享同一个id。毫无疑问这是从文档树中获取单个指定元素最快的方法。
注:如果给定的ID匹配某个元素的name特性,IE6.0还会返回这个元素。这是一个bug,也是必须非常小心的一个问题。
5.创建新节点
最常用到的几个方法是
代码
  1. createDocumentFragment()--创建文档碎片节点
  2. createElement(tagname)--创建标签名为tagname的元素
  3. createTextNode(text)--创建包含文本text的文本节点
  4. createElement()、createTextNode()、appendChild()
  5. 1<html>
  6. 2    <head>
  7. 3        <title>createElement() Example</title>
  8. 4        <script type=”text/javascript”>
  9. 5            function createMessage() {
  10. 6                var oP = document.createElement(“p”);
  11. 7                var oText = document.createTextNode(“Hello World!”);
  12. 8                oP.appendChild(oText);
  13. 9                document.body.appendChild(oP);
  14. 10            }
  15. 11        </script>
  16. 12    </head>
  17. 13    <body onload=”createMessage()”>
  18. 14    </body>
  19. 15</html>
  20. removeChild()、replaceChild()、insertBefore()
  21. 删除节点
  22. 1<html>
  23. 2    <head>
  24. 3        <title>removeChild() Example</title>
  25. 4        <script type=”text/javascript”>
  26. 5            function removeMessage() {
  27. 6                var oP = document.body.getElementsByTagName(“p”)[0];
  28. 7                oP.parentNode.removeChild(oP);
  29. 8            }
  30. 9        </script>
  31. 10    </head>
  32. 11    <body onload=”removeMessage()”>
  33. 12        <p>Hello World!</p>
  34. 13    </body>
  35. 14</html>
  36. 替换
  37. 1<html>
  38. 2    <head>
  39. 3        <title>replaceChild() Example</title>
  40. 4        <script type=”text/javascript”>
  41. 5            function replaceMessage() {
  42. 6                var oNewP = document.createElement(“p”);
  43. 7                var oText = document.createTextNode(“Hello Universe!”);
  44. 8                oNewP.appendChild(oText);
  45. 9                var oOldP = document.body.getElementsByTagName(“p”)[0];
  46. 10                oOldP.parentNode.replaceChild(oNewP, oOldP);
  47. 11            }
  48. 12        </script>
  49. 13    </head>
  50. 14    <body onload=”replaceMessage()”>
  51. 15        <p>Hello World!</p>
  52. 16    </body>
  53. 17</html
新消息添加到旧消息之前
代码
  1. 1<html>
  2. 2    <head>
  3. 3        <title>insertBefore() Example</title>
  4. 4        <script type=”text/javascript”>
  5. 5            function insertMessage() {
  6. 6                var oNewP = document.createElement(“p”);
  7. 7                var oText = document.createTextNode(“Hello Universe!”);
  8. 8                oNewP.appendChild(oText);
  9. 9                var oOldP = document.getElementsByTagName(“p”)[0];
  10. 10                document.body.insertBefore(oNewP, oOldP);
  11. 11            }
  12. 12        </script>
  13. 13    </head>
  14. 14    <body onload=”insertMessage()”>
  15. 15        <p>Hello World!</p>
  16. 16    </body>
  17. 17</html>
createDocumentFragment()
一旦把节点添加到document.body(或 者它的后代节点)中,页面就会更新并反映出这个变化。对于少量的更新,这是很好的,然而,当要向document添加大量数据时,如果逐个添加这些变动, 这个过程有可能会十分缓慢。为解决这个问题,可以创建一个文档碎片,把所有的新节点附加其上,然后把文档碎片的内容一次性添加到document中,假如 想创建十个新段落
Js代码
  1. 1<html>
  2. 2    <head>
  3. 3        <title>insertBefore() Example</title>
  4. 4        <script type=”text/javascript”>
  5. 5            function addMessages() {
  6. 6                var arrText = [“first”, “second”, “third”, “fourth”, “fifth”, “sixth”, “seventh”, “eighth”, “ninth”, “tenth”];
  7. 7
  8. 8                var oFragment = document.createDocumentFragment();
  9. 9
  10. 10                for (var i=0; i < arrText.length; i++) {
  11. 11                    var oP = document.createElement(“p”);
  12. 12                    var oText = document.createTextNode(arrText[i]);
  13. 13                    oP.appendChild(oText);
  14. 14                    oFragment.appendChild(oP);
  15. 15                }
  16. 16
  17. 17                document.body.appendChild(oFragment);
  18. 18
  19. 19            }
  20. 20        </script>
  21. 21    </head>
  22. 22    <body onload=”addMessages()”>
  23. 23
  24. 24    </body>
  25. 25</html>
6.让特性像属性一样
大部分情况下,HTML DOM元素中包含的所有特性都是可作为属性。
假设有如下图像元素:
Js代码
  1. <img src = “mypicture.jpg” border=0 />
  2. 如果要使用核心的DOM来获取和设置src和border特性,那么要用getAttribute()和setAttribute()方法:
  3. alert(oImg.getAttribute(“src”));
  4. alert(oImg.getAttribute(“border”));
  5. oImg.setAttribute(“src”,”mypicture2.jpg”);
  6. oImg.setAttribute(“border”,1);
  7. 然而,使用HTML DOM,可以使用同样名称的属性来获取和设置这些值:
  8. alert(oImg.src);
  9. alert(oImg.border);
  10. oImg.src=”mypicture2.jpg”;
  11. oImg.border =”1″;
唯一的特性名和属性名不一样的特例是class属性,它是用来指定应用于某个元素的一个CSS类,因为class在ECMAScript中是一个保留字,在javascript中,它不能被作为变量名、属性名或都函数名。于是,相应的属性名就变成了className;
注:IE在setAttribute()上有很大的问题,最好尽可能使用属性。

7.table方法
为了协助建立表格,HTML DOM给<table/>,<tbody/>和<tr/>等元素添加了一些特性和方法。
给<table/>元素添加了以下内容:
特性/方法 说明

Js代码
  1. caption 指向<caption/>元素并将其放入表格
  2. tBodies <tbody/>元素的集合
  3. tFoot 指向<tfoot/>元素(如果存在)
  4. tHead 指向<thead/>元素(如果存在)
  5. rows 表格中所有行的集合
  6. createTHead() 创建<thead/>元素并将其放入表格
  7. createTFood() 创建<tfoot/>元素并将其放入表格
  8. createCpation() 创建<caption/>元素并将其放入表格
  9. deleteTHead() 删除<thead/>元素
  10. deleteTFood() 删除<tfoot/>元素
  11. deleteCaption() 删除<caption/>元素
  12. deleteRow(position) 删除指定位置上的行
  13. insertRow(position) 在rows集合中的指定位置上插入一个新行
<tbody/>元素添加了以下内容
特性/方法 说明
rows <tbody/>中所有行的集合
deleteRow(position) 删除指定位置上的行
insertRow(position) 在rows集合中的指定位置上插入一个新行

<tr/>元素添加了以下内容
特性/方法 说明
cells <tr/>元素中所有的单元格的集合
deleteCell(postion) 删除给定位置上的单元格
insertCell(postion) 在cells集合的给点位置上插入一个新的单元格