数学美 之 判断线段相交的最简方法

zh

解析几何的巅峰 是 向量 那无关过程的狂妄与简洁 映射着大自然无与伦比的美

引子

如何判断两条直线是否相交?

这很容易。平面直线,无非就是两种关系:相交 或 平行。因此,只需判断它们是否平行即可。而直线平行,等价于它们的斜率相等,只需分别计算出它们的斜率,即可做出判断。

但倘若我把“直线”换成“线段”呢——如何判断两条线段是否相交?

这就有些难度了。和 直线 不同,线段 是有固定长度的,即使它们所属的两条直线相交,这两条线段也不一定相交。

也许你会说:分情况讨论不就行了嘛:

  • 先计算两条线段的斜率,判断是否平行。若平行,则一定不相交。
  • 若不平行,求出两条线段的直线方程,联立之,解出交点坐标。
  • 运用定比分点公式,判断交点是否在两条线段上。

的确,从理论上这是一个可行的办法,这也是人们手动计算时普遍采用的方法。

然而,这个方法并不怎么适用于计算机。原因如下:

  • 计算中出现了除法(斜率计算、定比分点),因此每次计算前都要判断除数是否为 0(或接近 0)。这很麻烦,严重干扰逻辑的表达。
  • 浮点精度丢失带来的误差。人类计算时可以采用分数,但计算机不行。计算机在储存浮点数时会有精度丢失的现象。一旦算法的计算量大起来,误差会被急剧放大,影响结果准确性。
  • 效率低下。浮点乘除会十分耗时,不适用于对实时性要求较高的生产环境(如 游戏)。

那么,有更好的方法?

当然有。

READ MORE

17 行代码实现的简易 Javascript 字符串模板

zh

这是源于两年前,当我在做人生中第一个真正意义上的网站时遇到的一个问题。该网站采用前后端分离的方式,由后端的 REST 接口返回 JSON 数据,再由前端渲染到页面上。

同许多初学 Javascript 的菜鸟一样,起初,我也是采用拼接字符串的形式,将 JSON 数据嵌入 HTML 中。开始时代码量较少,暂时还可以接受。但当页面结构复杂起来后,其弱点开始变得无法忍受起来:

  • 书写不连贯。每写一个变量就要断一下,插入一个 +"。十分容易出错。
  • 无法重用。HTML 片段都是离散化的数据,难以对其中重复的部分进行提取。
  • 无法很好地利用 <template> 标签。这是 HTML5 中新增的一个标签,标准极力推荐将 HTML 模板放入 <template> 标签中,使代码更简洁。

为了解决这个问题,我暂时放下了手上的项目,花了半个小时实现一个极简易的字符串模板。

READ MORE

Python“黑魔法”之 Meta Classes

zh

接触过 Django 的同学都应该十分熟悉它的 ORM 系统。对于 python 新手而言,这是一项几乎可以被称作“黑科技”的特性:只要你在 models.py 中随便定义一个 Model 的子类,Django 便可以:

  • 获取它的字段定义,并转换成表结构
  • 读取 Meta 内部类,并转化成相应的配置信息。对于特殊的 Model(如 abstractproxy),还要进行相应的转换
  • 为没有定义 objectsModel 加上一个默认的 Manager

开发之余,我也曾脑补过其背后的原理。曾经,我认为是这样的:

启动时,遍历models.py中的所有属性,找到Model的子类,并对其进行上述的修改。

当初,我还以为自己触碰到了真理,并曾将其应用到实际生产中——为 SAE 的 KVDB 写了一个类 ORM 系统。然而在实现的过程中,我明显感受到了这种方法的丑陋,而且性能并不出色(因为要遍历所有的定义模块)。

那么事实上,Django 是怎么实现的呢?

自古以来我们制造东西的方法都是“自上而下”的,是用切削、分割、组合的方法来制造。然而,生命是自下而上地,自发地建造起来的,这个过程极为低廉。 ——王晋康《水星播种》

这句话揭示了生命的神奇所在:真正的生命都是由基本物质自发构成的,而非造物主流水线式的加工

那么,如果 类 也有生命的话,对它自己的修饰就不应该由调用者来完成,而应该是自发的

幸而,python 提供了造物主的接口——这便是 Meta Classes,或者称为“元类”。

READ MORE

【译】响应式图片的现状

zh

原文链接:戳这里

Web 是一种可视化的媒体。绚丽的视觉效果,很大程度上离不开图片文件所作出的贡献。虽然(Whilst)其中的许多效果都可以用 CSS 和 内联 SVG 来实现,互联网上的许多站点仍需要图片文件。

从去年的统计来看,每个站点中,图片平均占了一半的页面体积,并且随着时间的推移,图片体积有持续增加的趋势;就 2014 年而言,图片的大小便增长了 **21%**。

与此同时,互联网终端的种类、数量也在增长。从 72 ppi(市场份额正在下降)到 600 ppi,不同设备的分辨率(resolution)有着天壤之别。

创建能在任何设备中都有着高质量的图片,其实再容易不过了——用 1000 ppi 的质量保存图片,然后就可以不用再理他了(译者注:原文是 call it a day)。生成的图片,即使是在分辨率最高的设备上查看也是十分清晰的(crisp)。但是,在图片质量提升的同时,图片文件的大小也会相应地增加。要知道,页面加载时间可是影响用户体验的首要因素——因此,保证站点能够及时地呈现在用户面前是我们义不容辞(incrumbent)的责任。高质量的图片,即使是在宽带环境下加载也要耗费几十秒,更不用说(let alone)是移动端的设备了——简直就是无法使用。

响应式图片的目的,不是要为设备提供尽可能高质量的图片(这一点,我们很容易做到),而是要为设备提供它所能支持的最高质量的图片,仅此而已(nothing more)。

从这篇指南中,你将了解到响应式图片的工作原理(what works),响应式图片仍然存在的问题和陷阱(pitfall),以及如何将响应式图片运用到网站中。

READ MORE

【译】“为什么有这么多的编程语言?”

zh

原文链接:戳这里

在过去的一周中,几位同事曾两次问了我这个问题。听起来,这像是一个糟糕的问题,但事实上并不是这样的。

最简短的答案就是:尽管我们并不需要这么多语言,但我们还是想要(want)它们。 让我们再探索得更深一些吧。

READ MORE

Wisecity 商赛总结——也谈前端自动化测试

zh
mybirth:5MfFa8SHlDQ1RpMhYDlStQ==:WZKJhI2CFBLPFLiabJ79JQ==:
**THIS CONTENT IS ENCRYPTED**
 
DECRYPTING...
READ MORE

记一次 DoS 诈骗网站的经历

zh
mybirth:hUeY3Bw1xWsNki6GswV0JQ==:rTdeAcCAcNTUPlnCHEl9uw==:
**THIS CONTENT IS ENCRYPTED**
 
DECRYPTING...
READ MORE

博客迁移至 Github.io

zh

为什么迁出?

话说SinaAppEngine真是越来越不像话了:在没有征得我们开发者的同意的情况下擅自把应用总数限制调整为 5 个(整整少了一半!),还口口声声说是作过调查——

“大约 90% 开发者只用 5 个应用就足够了。”

同时,增加配额的钱还那么贵,实在担负不起的我只好精简应用数目,以防未来某天应用数不够用。

为什么选择 Github Pages?

本人爱好程序,习惯以代码的方式来做事——写文章时也不例外。因此,我需要找到一个支持 Markdown 的博客平台进行迁移。为此,我经历了很长时间的思想斗争——

新浪、网易 等国内博客平台?

果断否决。这些平台都是面向大众的,只提供富文本编辑器,效率捉急。

博客园?“程序员的网上家园”,总会好一些吧?

虽说最近博客园推出了 Markdown 编辑器,一切似乎很美好。但是——它——没有即时预览的功能!!这么重要的东西都不加上,写作时就像浑水中摸鱼一样,别提多不爽了。再说了,在博客园上聚集的多是些常工作于 Windows 平台下的程序员,在“信仰”方面有些合不来(别打我~~)。思考再三,还是否决了。

而事实上,比起公共博客平台,我还是比较喜欢个人博客。一来逼格比较高,可以为将来的交友、面试等活动加分;二来可以随心所欲地自定义样式,使网站完全符合我的 Style。

这么一来,似乎就只剩下 Github Pages 了。

那么,如何在 Github Pages 上进行写作?

首先要介绍一下 Github Pages 的架构。先看看 Github 的介绍

Using Jekyll

Every GitHub Page is run through Jekyll when you push content to a specially named branch within your repository. For User Pages, use the master branch in your username.github.io repository. For Project Pages, use the gh-pages branch in your project’s repository. Because a normal HTML site is also a valid Jekyll site, you don’t have to do anything special to keep your standard HTML files unchanged. Jekyll has thorough documentation that covers its features and usage. Simply start committing Jekyll formatted files and you’ll be using Jekyll in no time.

可以看得出来,Github Pages 使用 Jekyll 作为后端引擎——这是一个用 Ruby 写的博客框架。但用户不需要写一行 Ruby 的代码,只需在名为 <username>.github.io 的项目下面以一定的目录结构放置 markdown 文件,Jekyll 便会自动生成整个站点。

这里需要注意的是,Jekyll 生成的站点是静态的,也就是说站点的文件是 Jekyll 编译好之后存放在服务器端的,而不是接到请求之后才去编译站点,因此站点的访问速度是相当快的——这也是它的优点。

我被这种机制深深地震惊了:这是一种我从来没见过的写作方式,无论是从方式上,抑或是从形式上。Jekyll 能让你真正专注于写作,而不是其他一些无谓的东西。

它把一切无关的东西都摒弃了,这才是真正的极简主义。

最初的 Jekyll 站点是没有样式的。为了不重复发明轮子,我决定使用现成的主题。在网上略一搜索便有了收获:Jekyll Bootstrap

Bootstrap 是我最常用,也是最欣赏的一个前端框架。因此尽管这个主题仍在开发当中,我还是毫不犹豫地选中了它。

Github 上将这个项目 clone 下来,覆盖到 hsfzxjy.github.io 项目下,理论上,站点就可以运行了。接下来,进行一些样式上的微调就可以了。

至于评论系统,由于 Github Pages 是静态站点,因此只能使用第三方评论服务。Jekyll 默认的评论服务是 Disqus ——一个国外的评论服务站点,但考虑到我在国内,许多人无法使用 Facebook,Twitter 等社交平台登录评论,我将它替换为了多说。具体操作,可以参考 这里

Github Pages 上的文章只能在本地编辑,因而需要一个趁手的 Markdown 编辑器。在 Ubuntu 环境下我使用的是 ReText

sudo apt-get install retext
READ MORE

LCA 之离线 Tarjan 算法

zh

真是巧妙的算法!

比起树上倍增,Tarjan 算法实现起来更为简单,一个 DFS 加并查集即可。缺点便是:需要先把所有的查询都读进来,并且要储存结果。复杂度为 $O(n+q)$。

Code

var
sets: array [1..100] of longint;
visited: array [1..100] of Boolean;
a: array [1..100, 1..100] of Boolean;
questions: array [1..1000] of record
x, y: longint;
ans: longint;
end;
qn, n, i, m, x, y, root: longint;

function find(x: longint): longint;
begin
if x = sets[x] then exit(x);
sets[x] := find(sets[x]);
exit(sets[x]);
end;

procedure dfs(x: longint);
var
i: longint;
begin
visited[x] := true;
//对于两个节点都已访问到的询问,其结果已经出来了
for i := 1 to qn do
begin
if visited[questions[i].x] and visited[questions[i].y] then
if questions[i].x = x then
questions[i].ans := find(questions[i].y)
else if questions[i].y = x then
questions[i].ans := find(questions[i].x);
end;
for i := 1 to n do
begin
if not a[i, x] or visited[i] then continue;
dfs(i);
sets[find(i)] := x;
end;
end;

begin
assign(input, 'main.in'); reset(input);
assign(output, 'main.out'); rewrite(output);

read(n, m);
for i := 1 to n do
sets[i] := i;
for i := 1 to m do
begin
read(x, y);
a[x, y] := true;
a[y, x] := True;
end;
read(root);
qn := 0;
while not eof do
begin
inc(qn);
read(questions[qn].x, questions[qn].y);
end;
dfs(root);
for i := 1 to qn do
writeln(questions[i].ans);

close(input); close(output);
end.
READ MORE

LCA 树上倍增

zh
var
a: array [1..100, 1..100] of boolean;
depth: array [1..100] of longint;
father: array [1..100, 0..16] of longint;
n, m, i, x, y: longint;
root: longint;

procedure dfs(x: longint);
var
i: longint;
j: longint;
begin
depth[x] := depth[father[x][0]]+1;
j := 1;
while 1<<j<=depth[x]-1 do
begin
father[x][j] := father[father[x][j-1]][j-1];
inc(j);
end;
for i := 1 to n do
begin
if not a[x][i] or (father[x][0] = i) then continue;
father[i][0] := x;
dfs(i);
end;
end;

procedure swap(var x, y: longint);
var
t: longint;
begin
t := x;
x := y;
y := t;
end;

function lca(x, y: longint): longint;
var
t, j: longint;
begin
if depth[x] < depth[y] then
swap(x, y);

t := depth[x] - depth[y];
for j := 0 to 15 do
if t and (1<<j) <> 0 then
x := father[x][j];
if x = y then
exit(x);
for j := 15 downto 0 do
if father[x][j] <> father[y][j] then
begin
x := father[x][j];
y := father[y][j];
end;
lca := father[x][0];
end;

begin
assign(input, 'main.in'); reset(input);
assign(output, 'main.out'); rewrite(output);

read(n, m);
for i := 1 to m do
begin
read(x, y);
a[x, y] := true;
a[y, x] := true;
end;
read(root);
father[root][0] := root;
dfs(root);
while not eof do
begin
read(x, y);
writeln(lca(x, y));
end;

close(input); close(output);
end.
READ MORE