Pure White

给大家推荐一个 B 站宝藏 up 主 —— BiBiPiano

2022-03-15T17:23:00.000Z

今天想发一点和技术无关的内容，毕竟生活中也不全是工作嘛😊。

关注这个 up 主已经很久了，已经经过了很长时间的检验，在这里也推荐给大家。

这个 up 主发的所有曲子我都会第一时间听。

另外，记得一定要看简介，一定要看简介，一定要看简介！

这里我尝试使用嵌入代码给大家推荐三首曲子，不过推荐大家跳转到原页面，一边看简介一边听。

卡农（必听）

风居住的街道

可惜不是你

Rustc Reading Club：从一个错误出发学习 rustc_resolve

2021-11-07T07:38:31.000Z

最近 Rust 官方社区搞了个 Rustc Reading Club 的活动，由编译器 team 的 Leader Niko 发起，具体网址在这里：https://rust-lang.github.io/rustc-reading-club/

很可惜的是，11 月 4 日的第一期，由于太过火爆并且 Zoom 人数限制 100 人，导致主持人 Niko 自己进不来所以取消了……等待看看官方后续会怎么搞吧，还是很期待官方组织的活动的。

Rust 中文社群的张汉东大佬也紧跟着官方的活动，在社群里面组织了 Rustc 源码阅读的活动，今天（11 月 7 日）举办了第一期，在这期中我跟着吴翱翔大佬的思路，从一个错误出发，学习了一部分 rustc_resolve 的逻辑，于是想着写一篇博客总结一下。

【小广告】下一期 11 月 14 日下午会由刘翼飞大佬带领大家一起去阅读类型推导相关的代码，有兴趣的同学可以下载飞书，注册一个个人账号，然后扫描二维码加入：

准备工作

言归正传，在阅读 Rustc 源代码之前，我们需要先做一些准备工作，主要是先 clone 下来 Rust 的代码，然后配置好 IDE（虽然但是，Clion 到现在正式版还不支持远程，EAP 又各种 bug……），具体可以参考官方的 guide：https://rustc-dev-guide.rust-lang.org/getting-started.html。跟着这章做完就行：https://rustc-dev-guide.rust-lang.org/building/how-to-build-and-run.html。

从错误出发

这次我们的阅读主要的对象是rustc_resolve，顾名思义应该是做名称解析的，更加详细的信息可以来这瞅一眼：https://rustc-dev-guide.rust-lang.org/name-resolution.html。

我们打开rustc_resolve的lib.rs一看，妈呀，光这个文件就接近 4000 行代码，直接这么硬看肯定不现实；不过吴翱翔大佬提出了一个思路：从一个我们最常见的错误the name xx is defined multiple times出发，顺着这条路去学习一下相关的代码。

这是一个很好的办法，当你不知道从哪入手的时候，你可以构造一个场景，由点切入，最终由点及面看完所有代码。

废话少说，我们先祭出搜索大法，在rustc_resolve里面搜一下这个错误是在哪出现的：

非常巧，正好就在rustc_resolve的lib.rs中，于是我们跳转过去，发现确实是这个我们想找的错误：

let msg = format!("the name `{}` is defined multiple times", name);

let mut err = match (old_binding.is_extern_crate(), new_binding.is_extern_crate()) {
    (true, true) => struct_span_err!(self.session, span, E0259, "{}", msg),
    (true, _) | (_, true) => match new_binding.is_import() && old_binding.is_import() {
        true => struct_span_err!(self.session, span, E0254, "{}", msg),
        false => struct_span_err!(self.session, span, E0260, "{}", msg),
    },
    _ => match (old_binding.is_import(), new_binding.is_import()) {
        (false, false) => struct_span_err!(self.session, span, E0428, "{}", msg),
        (true, true) => struct_span_err!(self.session, span, E0252, "{}", msg),
        _ => struct_span_err!(self.session, span, E0255, "{}", msg),
    },
};

所在的这个函数名也正好是report_conflict，完美！

让我们接着看看这个函数在哪被调用到了：

这个函数除了定义外，被调用到了两次，其中下面这次是在自己函数内部递归调用，我们直接无视掉；还有一次是在build_reduced_graph.rs中，让我们跟着去看看：

在这里是被define方法调用到，看着很符合预期，看来我们找对地方了。

这段代码先通过to_name_binding方法把传入的def转换成一个NameBinding，让我们看看这段干了啥：

NameBinding是一个记录了一个值、类型或者模块定义的结构体，其中kind我们大胆猜测是类型，ambiguity看不懂先放着，expansion也是（如果看过 rustc-dev-guide 能大致知道是和卫生宏展开有关，这里我们也先无视），然后是span也不知道干啥的，点进去研究下感觉和增量编译有关，也先放着，最后vis估摸着应该表示的是可见性。

然后我们再点ResolverArenas看看是干啥的：

/// Nothing really interesting here; it just provides memory for the rest of the crate.
#[derive(Default)]
pub struct ResolverArenas<'a> {
    ...
}

嗯，好，没啥值得关注的，只是用来提供内存的，直接无视。

我们再接着回到上面的define方法中：

impl<'a> Resolver<'a> {
    /// Defines `name` in namespace `ns` of module `parent` to be `def` if it is not yet defined;
    /// otherwise, reports an error.
    crate fn define(&mut self, parent: Module<'a>, ident: Ident, ns: Namespace, def: T)
    where
        T: ToNameBinding<'a>,
    {
        let binding = def.to_name_binding(self.arenas);
        let key = self.new_key(ident, ns);
        if let Err(old_binding) = self.try_define(parent, key, binding) {
            self.report_conflict(parent, ident, ns, old_binding, &binding);
        }
    }
    ...
}

第二句let key = self.new_key(ident, ns);看着也没啥特殊的，就是根据当前所在的namespace给ident（表示标识符）新建一个key，那么 value 应该就是上面的binding了。

然后这里调用了try_define，如果返回了 Err 就调用report_conflict，让我们接着进入try_define看看（先不用仔细看）：

// Define the name or return the existing binding if there is a collision.
crate fn try_define(
    &mut self,
    module: Module<'a>,
    key: BindingKey,
    binding: &'a NameBinding<'a>,
) -> Result<(), &'a NameBinding<'a>> {
    let res = binding.res();
    self.check_reserved_macro_name(key.ident, res);
    self.set_binding_parent_module(binding, module);
    self.update_resolution(module, key, |this, resolution| {
        if let Some(old_binding) = resolution.binding {
            if res == Res::Err {
                // Do not override real bindings with `Res::Err`s from error recovery.
                return Ok(());
            }
            match (old_binding.is_glob_import(), binding.is_glob_import()) {
                (true, true) => {
                    if res != old_binding.res() {
                        resolution.binding = Some(this.ambiguity(
                            AmbiguityKind::GlobVsGlob,
                            old_binding,
                            binding,
                        ));
                    } else if !old_binding.vis.is_at_least(binding.vis, &*this) {
                        // We are glob-importing the same item but with greater visibility.
                        resolution.binding = Some(binding);
                    }
                }
                (old_glob @ true, false) | (old_glob @ false, true) => {
                    let (glob_binding, nonglob_binding) =
                        if old_glob { (old_binding, binding) } else { (binding, old_binding) };
                    if glob_binding.res() != nonglob_binding.res()
                        && key.ns == MacroNS
                        && nonglob_binding.expansion != LocalExpnId::ROOT
                    {
                        resolution.binding = Some(this.ambiguity(
                            AmbiguityKind::GlobVsExpanded,
                            nonglob_binding,
                            glob_binding,
                        ));
                    } else {
                        resolution.binding = Some(nonglob_binding);
                    }
                    resolution.shadowed_glob = Some(glob_binding);
                }
                (false, false) => {
                    return Err(old_binding);
                }
            }
        } else {
            resolution.binding = Some(binding);
        }

        Ok(())
    })
}

看着比较长，让我们一点一点来。

第一句let res = binding.res();就有点懵了，res是啥？result？response？其实都不是，我们点进去看看，一直点到底，会发现其实是resolution的缩写：

/// The resolution of a path or export.
///
/// For every path or identifier in Rust, the compiler must determine
/// what the path refers to. This process is called name resolution,
/// and `Res` is the primary result of name resolution.
///
/// For example, everything prefixed with `/* Res */` in this example has
/// an associated `Res`:
///
/// ```
/// fn str_to_string(s: & /* Res */ str) -> /* Res */ String {
///     /* Res */ String::from(/* Res */ s)
/// }
///
/// /* Res */ str_to_string("hello");
/// ```
///
/// The associated `Res`s will be:
///
/// - `str` will resolve to [`Res::PrimTy`];
/// - `String` will resolve to [`Res::Def`], and the `Res` will include the [`DefId`]
///   for `String` as defined in the standard library;
/// - `String::from` will also resolve to [`Res::Def`], with the [`DefId`]
///   pointing to `String::from`;
/// - `s` will resolve to [`Res::Local`];
/// - the call to `str_to_string` will resolve to [`Res::Def`], with the [`DefId`]
///   pointing to the definition of `str_to_string` in the current crate.
//
#[derive(Clone, Copy, PartialEq, Eq, Encodable, Decodable, Hash, Debug)]
#[derive(HashStable_Generic)]
pub enum Res {
    ...
}

好的，这条语句就是获得了我们刚才初始化的binding的resolution，我们接着看：

1 2	self.check_reserved_macro_name(key.ident, res); self.set_binding_parent_module(binding, module);

先看第一行的check_reserved_macro_name：

crate fn check_reserved_macro_name(&mut self, ident: Ident, res: Res) {
    // Reserve some names that are not quite covered by the general check
    // performed on `Resolver::builtin_attrs`.
    if ident.name == sym::cfg || ident.name == sym::cfg_attr {
        let macro_kind = self.get_macro(res).map(|ext| ext.macro_kind());
        if macro_kind.is_some() && sub_namespace_match(macro_kind, Some(MacroKind::Attr)) {
            self.session.span_err(
                ident.span,
                &format!("name `{}` is reserved in attribute namespace", ident),
            );
        }
    }
}

好像也没啥特殊的，就是看看有没有用到保留关键字，先无视掉吧；

再看看第二行set_binding_parent_module：

fn set_binding_parent_module(&mut self, binding: &'a NameBinding<'a>, module: Module<'a>) {
    if let Some(old_module) = self.binding_parent_modules.insert(PtrKey(binding), module) {
        if !ptr::eq(module, old_module) {
            span_bug!(binding.span, "parent module is reset for binding");
        }
    }
}

hmmm……好像是绑定了所在的 module，看着也没啥特殊的，也跳过吧。

接着往下看，这一段是重头戏了，让我们先进入update_resolution看看：

这里我们只关注：

let resolution = &mut *self.resolution(module, key).borrow_mut();
...

let t = f(self, resolution);

这两行，这两行应该是主要逻辑。

首先，我们调用了self.resolution，我们进去看看：

这里又调用了resolutions：

这里我们发现又有一段新的逻辑，我们看下字段的注释：

会发现其实 module 的 resolution 是 lazy 计算的，ok，具体的build_reduced_graph_external想必就是计算的部分，我们在这里先跳过，作为一个黑盒，之后再去探究。

好了，现在回过头继续看刚才的代码：

在resolution方法中，我们获取到了当前模块的所有resolutions，然后看看key是否存在，不存在就创建一个新的，并返回这个resolution。

再回到上层代码：

let resolution = &mut *self.resolution(module, key).borrow_mut();
...

let t = f(self, resolution);

这里我们拿到了resolution后调用了传入的 f，让我们回到try_define中，先看 else 部分：

self.update_resolution(module, key, |this, resolution| {
    if let Some(old_binding) = resolution.binding {
        ...
    } else {
        resolution.binding = Some(binding);
    }

    Ok(())
})

这里如果返回的resolution的binding是None（对应上面resolution方法中新建的resolution，之前不存在），那么就把resolution的binding设为当前的binding然后返回Ok，逻辑还是比较简单的。

好了，让我们再接着看看如果原来已经有了一个binding，rustc 会如何处理：

let res = binding.res();

...

self.update_resolution(module, key, |this, resolution| {
    if let Some(old_binding) = resolution.binding {
        if res == Res::Err {
            // Do not override real bindings with `Res::Err`s from error recovery.
            return Ok(());
        }
        ...

这里如果之前返回的 res 本身就是 Err 的话，就直接返回，我们看一下 Err 的注释：

嗯，这部分直接无视吧，我们接着看：

let res = binding.res();
self.update_resolution(module, key, |this, resolution| {
    if let Some(old_binding) = resolution.binding {
        ...
        match (old_binding.is_glob_import(), binding.is_glob_import()) {
            (true, true) => {
                if res != old_binding.res() {
                    resolution.binding = Some(this.ambiguity(
                        AmbiguityKind::GlobVsGlob,
                        old_binding,
                        binding,
                    ));
                } else if !old_binding.vis.is_at_least(binding.vis, &*this) {
                    // We are glob-importing the same item but with greater visibility.
                    resolution.binding = Some(binding);
                }
            }
            ...

如果说新的和旧的都是glob_import，那么我们判断一下当前的res和之前的res是否是同一个，如果不是就说明出现了模糊性，我们把resolution的binding设置成ambiguity（模糊的意思）；如果两个res是同一个，那我们再判断一下可见性，如果说新的可见性更大，那我们就直接替换。

这里大家就会疑惑了，glob_import是啥？我们来插入一个小插曲：

fn import_kind_to_string(import_kind: &ImportKind<'_>) -> String {
    match import_kind {
        ImportKind::Single { source, .. } => source.to_string(),
        ImportKind::Glob { .. } => "*".to_string(),
        ImportKind::ExternCrate { .. } => "".to_string(),
        ImportKind::MacroUse => "#[macro_use]".to_string(),
    }
}

看到这大家应该都知道了吧，我就不过多解释了。

好的，回归正题，看起来这段是处理use相关的，我们可以简单略过，接着往下看：

let res = binding.res();
self.update_resolution(module, key, |this, resolution| {
    if let Some(old_binding) = resolution.binding {
        ...
        match (old_binding.is_glob_import(), binding.is_glob_import()) {
            ...
            (old_glob @ true, false) | (old_glob @ false, true) => {
                let (glob_binding, nonglob_binding) =
                    if old_glob { (old_binding, binding) } else { (binding, old_binding) };
                if glob_binding.res() != nonglob_binding.res()
                    && key.ns == MacroNS
                    && nonglob_binding.expansion != LocalExpnId::ROOT
                {
                    resolution.binding = Some(this.ambiguity(
                        AmbiguityKind::GlobVsExpanded,
                        nonglob_binding,
                        glob_binding,
                    ));
                } else {
                    resolution.binding = Some(nonglob_binding);
                }
                resolution.shadowed_glob = Some(glob_binding);
            }
            ...

这一段我们处理了一个glob_import和一个非glob_import的情况，简单来说原则就是，非glob的优先，但是有个例外：如果非glob的是在宏中的，那么这里就会导致“模糊”（Rust 是卫生宏），这里会像上文一样把binding设为ambiguity。

这部分的逻辑涉及到宏的相关知识，我们先作为一个黑盒跳过，反正大概了解到了非glob优先，会shadow掉glob就完事，这也符合我们的编码经验和人体工程学。

好，我们最后看最简单的一部分：

let res = binding.res();
self.update_resolution(module, key, |this, resolution| {
    if let Some(old_binding) = resolution.binding {
        ...
        match (old_binding.is_glob_import(), binding.is_glob_import()) {
            ...
            (false, false) => {
                return Err(old_binding);
            }
            ...

如果两个名字都不是glob引入的，那么就说明在当前的命名空间中我们出现了俩一样的名字（要注意在这里解析的不是变量名，所以不允许有一样的），那么就说明出错了，返回错误抛给上层，也就是我们的define方法中，并报错：

/// Defines `name` in namespace `ns` of module `parent` to be `def` if it is not yet defined;
/// otherwise, reports an error.
crate fn define(&mut self, parent: Module<'a>, ident: Ident, ns: Namespace, def: T)
where
    T: ToNameBinding<'a>,
{
    let binding = def.to_name_binding(self.arenas);
    let key = self.new_key(ident, ns);
    if let Err(old_binding) = self.try_define(parent, key, binding) {
        self.report_conflict(parent, ident, ns, old_binding, &binding);
    }
}

总结

好了，至此，我们看完了我们开头所说的the name xx is defined multiple times相关的逻辑啦。

不过我们仍然遗留了一些问题，大家可以继续深入探究一下：

binding被标记为ambiguity后，会发生什么？
module的resolution是怎么被解析出来的？也就是我们略过的build_reduced_graph_external干了啥？
宏展开导致的冲突为什么要特殊对待？

大家可以顺着以上的问题继续探究，欢迎大家留言评论或者加入 Rust 中文社群一起讨论学习 Rust~

The Rustonomicon 的中文翻译

2021-09-23T09:50:56.000Z

最近在学习 Rust，发现 Rust 社区真的是有非常丰富的资源，从社区中学到了很多有用的东西。与此同时，也一直想着能够为社区做点什么。

正好发现《The Rustonomicon》（也称为 Rust 秘典、死灵书）之前的一版中文翻译（感谢@tjxing）是更新到了 2018 年，之后就再也没再更新维护过了；而这三年官方也对于这本书进行了大量的迭代升级，于是想着重新翻译一版，并尽可能持续跟进迭代，贡献给社区，也算是尽一份绵薄之力。

在线阅读地址：https://nomicon.purewhite.io/

github 地址：https://github.com/PureWhiteWu/nomicon-zh-Hans

一些想说的话

首先，限于译者自身姿势水平，翻译有可能无法做到完全信达雅，并且有一些专业术语不知道如何翻译到中文，在这里先向大家道歉，请多包涵。

不过，译者保证所有翻译的内容都是译者阅读并调整过多次的，并且译者会努力将内容调整到满足能看懂的要求，并且做到不遗漏原文内容。

如果大家对于翻译有更好的建议或者想法，欢迎直接 PR~

目前翻译基于 commit：2747c4bb2cbc0639b733793ddb0bf4e9daa2634e，基于时间：2021/9/19

Q：为什么不基于之前已有的中文版进行改进？

A：因为翻译成中文版后，很难再回过头去看和现在的英文版原文到底差了啥，所以还不如完全重新翻译一遍。

Q：那会不会有一天你的这个版本也过期了？

A：希望没有那一天。我 watch 了英文原版的所有 PR，如果有变更（希望）能及时更新。当然，也欢迎大家一起贡献 PR。

TODO

github 增加 action，合入 master 后自动更新线上版本
思考是否把英文原版和中文翻译按段落放在一起，方便查阅原版

也欢迎大家集思广益，一起建设 Rust 社区。

【译】Rust 常见的问题

2021-09-01T08:24:08.000Z

原文：https://github.com/dtolnay/rust-faq

本文档的存在是为了回答有关 Rust 编程语言的常见问题。它不是一个完整的语言指南，也不是一个教授该语言的工具。它只是一个参考，用来回答 Rust 社区中人们经常遇到的问题，并澄清 Rust 的一些设计决定背后的原因。

如果你觉得有一些常见的或重要的问题在这里没有得到解答，请在 GitHub 上针对这个 repo提一个 issue!

这些内容大部分以前都在 rust-lang/rust 库中，并且在网站上有一个专门的 FAQ 页面。但是在 2018 年的网站重新设计中，它被删除了。我在这里把它恢复了，因为这些问题中的许多问题仍然被频繁询问。

The Rust Project

这个项目的目标是什么？

设计并实现一种安全的、并发的、实用的系统级语言。

Rust 之所以存在，是因为在这个抽象和效率水平上的其他语言并不令人满意。特别是：

对安全性的关注太少。
他们对并发性的支持很差。
缺乏实际的承受力。
它们对资源的控制有限。

Rust 作为一种替代方案存在，它既能提供高效的代码，又能提供舒适的抽象水平，同时在上述四点上都有改进。

这个项目是由 Mozilla 控制的吗？

Rust 在 2006 年作为 Graydon Hoare 的兼职项目开始，并保持了 3 年多。2009 年，当该语言成熟到可以运行基本测试并展示其核心概念时，Mozilla 参与其中。虽然它仍然由 Mozilla 赞助，但 Rust 是由来自世界各地不同地方的爱好者组成的一个多样化社区开发的。Rust 团队由 Mozilla 和非 Mozilla 成员组成，GitHub 上的rust到目前为止已经有超过2300 个独特的贡献者。

就项目管理而言，Rust 由一个核心团队管理，为项目设定愿景和优先级。从全球角度来指导它。还有一些子团队来指导和促进特定兴趣领域的发展，包括核心语言、编译器、Rust 库、Rust 工具和 Rust 官方社区的管理。这些领域的设计都是通过[RFC]（https://github.com/rust-lang/rfcs）来推进的。对于不需要 RFC 的变化，通过rustc仓库的 PR 来决定。

Rust的一些非目标是什么？

我们不采用任何特别前沿的技术。旧的、成熟的技术会更好。
我们并不把表现力、极简主义或优雅性置于其他目标之上。这些都是可取的，但是从属的目标。
我们不打算涵盖 C++ 或任何其他语言的完整功能集。Rust 应该提供大多数情况下的功能。
我们不打算做到 100% 的静态，100% 的安全，100% 的反射，或在任何其他意义上过于教条化。存在权衡。
我们不要求 Rust 在“所有可能的平台”上运行。它最终必须在广泛使用的硬件和软件平台上没有不必要的妥协地运行。

Mozilla 在哪些项目中使用 Rust？

主要的项目是Servo，这是 Mozilla 正在进行的实验性浏览器引擎。他们也在努力将Rust 组件整合到 Firefox 中。

有哪些大型 Rust 项目的例子？

现在最大的两个 Rust 开源项目是Servo和Rust 编译器本身。

还有谁在使用 Rust？

越来越多的组织！

我怎样才能轻松地尝试 Rust？

尝试Rust的最简单方法是通过playpen，这是一个用于编写和运行 Rust 代码的在线应用程序。如果你想在你的系统上尝试 Rust，安装它并通过书中的猜谜游戏教程。

我怎样才能得到 Rust 问题的帮助？

有几种方法。你可以。

在users.rust-lang.org，即 Rust 官方用户论坛上发帖
在官方的Rust IRC channel (#rust on irc.mozilla.org)中提问。
在Stack Overflow上用“rust”标签提问。
在/r/rust，非官方的 Rust 子论坛上发帖

为什么 Rust 随着时间的推移发生了如此大的变化？

Rust 最初的目标是创造一种安全但可用的系统编程语言。在追求这一目标的过程中，它探索了很多想法，其中一些被保留了下来（生命周期，Trait），而另一些则被抛弃了（类型状态系统，绿色线程）。另外，在 1.0 之前，很多标准库都被重写了，因为早期的设计被更新以最好地使用 Rust 的特性，并提供高质量的、一致的跨平台 API。现在 Rust 已经达到了 1.0，该语言被保证是“稳定的”；虽然它可能继续发展，但在当前 Rust 上运行的代码应该继续在未来的版本上运行。

Rust语言的版本管理是如何进行的？

Rust 的语言版本管理遵循SemVer，只有当需要进行编译器错误的修复、安全漏洞的修补或者需要更多注释以改变类型推断和分发的时候，才允许在小版本中对稳定的 API 进行向后不兼容的修改。更详细的小版本修改指南可参考语言和标准库的 RFC。

Rust 有三个“发布 channel”：稳定版、测试版和 nightly 版。稳定版和测试版每六周更新一次，当前的 nightly 版成为新的测试版，而当前的 nightly 版成为新的稳定版。标记为不稳定的语言和标准库功能或隐藏在特性开关后面的功能只能在 nightly 中使用。新功能以不稳定的形式出现，一旦被核心团队和相关的子团队批准，就会被“解禁”。这种方法允许实验，同时为稳定频道提供强大的向后兼容性保证。

更多的细节，请阅读 Rust 的博文“Stability as a Deliverable”。

我可以在测试版或稳定版频道上使用不稳定的功能吗？

不，你不能。Rust 努力为测试版和稳定版频道上提供的功能的稳定性提供强有力的保证。当某项功能不稳定时，这意味着我们还不能为它提供这些保证，并且不希望人们依赖它保持不变。这使我们有机会在 nightly 上尝试改变，同时仍然为寻求稳定的人保持强有力的保证。

事情一直在变稳定，测试版和稳定版频道每六周更新一次，其他时候偶尔也会接受测试版的修复。如果你在等待一个功能，而不使用 nightly，你可以通过检查问题追踪器上的B-unstable标签来定位其追踪问题。

什么是“特性开关”?

“特性开关”是 Rust 用来稳定编译器、语言和标准库的特性的机制。一个被“开关控制”的特性只有在 nightly 上才能访问，而且只有在通过#[feature]属性或-Z unstable-options命令行参数明确启用后才能访问。当一个特性被稳定化后，它就可以在稳定发布通道上使用，并且不需要明确启用，这时候这个特性就被认为是稳定的。特性开关允许开发者在开发中的实验性功能在它们在稳定语言中可用之前进行测试。

为什么要采用 MIT/ASL2 双许可证？

Apache 许可证包括对专利侵犯的重要保护，但它与 GPL 第 2 版不兼容。为了避免 Rust 与 GPL2 的使用出现问题，Rust 采用了 MIT 许可。

为什么是 BSD 风格的许可，而不是 MPL 或三合一许可？

这一方面是由于原始开发者（Graydon）的偏好，另一方面是由于语言往往比网络浏览器等产品有更广泛的受众和更多样化的可能嵌入和最终用途。我们希望尽可能多地吸引这些潜在的贡献者。

性能

Rust有多快？

非常快! 在许多基准测试中，Rust 已经可以与 C 和 C++ 竞争（比如基准游戏和其他）。

像 C++ 一样，Rust 把零成本抽象作为它的核心原则之一：Rust 的抽象没有一个施加全局性能惩罚，也没有传统意义上的任何运行时系统的开销。

鉴于 Rust 是建立在 LLVM 之上的，并努力从 LLVM 的角度类似于 Clang，任何 LLVM 的性能改进也有助于 Rust。从长远来看，Rust 的类型系统中更丰富的信息也应该能够实现 C/C++ 代码难以实现或无法实现的优化。

Rust 有垃圾收集吗？

不，Rust 的关键创新之一是在不需要垃圾收集的同时保证内存安全（无 segfault）。

通过避免 GC，Rust 可以提供许多好处：可预测的资源清理，较低的内存管理开销，以及基本上没有运行时系统。所有这些特征都使 Rust 变得精干，并且容易嵌入到任意的上下文中，并使其更容易将 Rust 代码与有 GC 的语言集成。

Rust 通过其所有权和借用系统避免了对 GC 的需求，但同样的系统也有助于解决一系列其他问题，包括
一般的资源管理和并发性。

当单一所有权不够用时，Rust 程序依靠标准的引用计数智能指针类型Rc，以及它的线程安全对应类型Arc，而不是 GC。

然而，我们正在研究可选的垃圾收集作为未来的扩展。我们的目标是使其能够顺利地与垃圾收集的运行时，例如那些由Spidermonkey和V8的 JavaScript 引擎提供的。最后，一些人已经在没有编译器的支持情况下研究了实现纯 Rust 垃圾收集器。

为什么我的程序很慢？

Rust 编译器不会用优化来编译，除非被要求这样做，因为优化会降低编译速度，而且在开发过程中通常是不可取的。

如果你用cargo编译，请使用--release标志。如果你直接用rustc编译，使用-O标志。这两个标志中的任何一个都会打开优化功能。

Rust的编译似乎很慢。这是为什么呢？

代码翻译和优化。Rust 提供了高水平的抽象，可以编译成高效的机器代码，这些翻译需要时间来运行，特别是在优化时。

但是 Rust 的编译时间并不像看起来那么糟糕，而且有理由相信它会有所改善。当比较 C++ 和 Rust 之间类似规模的项目时，一般认为整个项目的编译时间是相当的。人们普遍认为 Rust 的编译速度很慢，这在很大程度上是由于 C++ 和 Rust 的编译模型的不同。C++ 的编译单元是文件，而 Rust 的编译单元是由许多文件组成的 crate。因此，在开发过程中，修改一个 C++ 文件可能会导致比 Rust 少得多的重新编译。目前正在努力重构编译器以引入增量编译，这将为 Rust 提供 C++ 模型的编译时间优势。

除了编译模型之外，Rust 的语言设计和编译器实现还有其他几个方面会影响编译时的性能。

首先，Rust 有一个适度复杂的类型系统，必须花费不可忽视的编译时间来执行约束，使 Rust 在运行时安全。

其次，Rust 编译器有长期的技术债务，特别是产生了质量很差的 LLVM IR，LLVM 必须花时间“修复”。在 Rust 编译器中加入一个新的内部表示法，称为MIR，有可能进行更多的优化，提高生成的 LLVM IR 的质量，但这项工作还没有发生过。

第三，Rust 使用 LLVM 来生成代码是一把双刃剑：虽然它使 Rust 拥有世界一流的运行时性能，但 LLVM 是一个大型框架，不注重编译时的性能，特别是在处理质量差的输入时。

最后，虽然 Rust 的首选策略是单态泛型（类似于 C++），但它要求生成的代码比其他翻译策略多得多。Rust 的程序员可以使用特征对象，通过使用动态调度来换取这种代码的膨胀。

为什么 Rust 的`HashMap`很慢？

默认情况下，Rust 的HashMap使用 SipHash 散列算法，该算法旨在防止散列表碰撞攻击，同时提供各种工作负载下的合理性能。

虽然 SipHash 在许多情况下表现出有竞争力的性能，但它比其他散列算法明显慢的一种情况是在短键，如整数。这就是为什么 Rust 程序员经常观察到HashMap的性能缓慢。在这种情况下，经常推荐使用 FNV hasher，但要注意它不具备与 SipHash 一样的抗碰撞特性。

为什么没有集成的基准测试基础设施?

有，但它只在 nightly 上可用。我们最终计划建立一个可插拔的系统来进行综合基准测试，但与此同时，目前的系统被认为是不稳定的。

Rust 是否做了尾调用优化？

一般来说，不会。在有限的情况下可能会进行尾部调用优化，但不保证。由于这个功能一直是人们所希望的，Rust 保留了一个关键字（become），尽管目前还不清楚它在技术上是否可行，也不清楚它是否会被实现。曾经有一个拟议的扩展，允许在某些情况下消除尾随调用，但目前被推迟了。

Rust 有 runtime 吗？

不是 Java 等语言所使用的典型意义上的运行时，但是 Rust 标准库的一部分可以被认为是“运行时”，它提供了一个堆、回溯、解开和堆栈守护。有一个少量的初始化代码，在用户的main函数之前运行。Rust 标准库还链接了 C 标准库，它也做了类似的运行时初始化。Rust 代码可以在没有标准库的情况下进行编译，在这种情况下，运行时与 C 语言大致相当。

语法

为什么要用大括号? 为什么 Rust 的语法不能像 Haskell 或 Python 那样？

使用大括号来表示块是各种编程语言中常见的设计选择，而 Rust 的一致性对于已经熟悉这种风格的人来说是很有用的。

大括号还可以为程序员提供更灵活的语法，并在编译器中提供更简单的解析器。

我可以在`if`条件上不加小括号，那么为什么我必须在单行块周围加上大括号？为什么不允许使用 C 语言的风格?

C 语言要求“if”语句的条件必须有小括号，但大括号是可选的，而 Rust 对其“if”表达式做出了相反的选择。这使得条件语句与语句主体明确分开，并避免了可选大括号的危害，这可能导致在重构过程中出现容易被忽略的错误，比如苹果的 goto fail 错误。

为什么没有字典的字面语法？

Rust 的整体设计倾向于限制语言的大小，同时启用强大的库。虽然 Rust 确实为数组和字符串字面提供了初始化语法，但这是语言中唯一的集合类型。其他库定义的类型，包括无处不在的Vec集合类型，都使用宏进行初始化，如vec!宏。

这种使用 Rust 的宏设施来初始化集合的设计选择在未来可能会被通用地扩展到其他集合，不仅可以简单地初始化HashMap和Vec，还可以初始化其他集合类型，如BTreeMap。同时, 如果你想要一个更方便的初始化集合的语法, 你可以创建你自己的宏来提供它.

我应该在什么时候使用隐式返回？

Rust 是一种非常面向表达式的语言，而“隐式返回”是这种设计的一部分。像ifs, matches, 和普通块这样的结构在 Rust 中都是表达式。例如，下面的代码检查一个i64是否为奇数，通过简单地将其作为一个值来返回结果。

1
2
3

fn is_odd(x: i64) -> bool {
    if x % 2 != 0 { true } else { false }
}

虽然它可以进一步简化，比如说。

1
2
3

fn is_odd(x: i64) -> bool {
    x % 2 != 0
}

在每个例子中，函数的最后一行是该函数的返回值。需要注意的是，如果一个函数以分号结束，其返回类型将是()，表示没有返回值。隐式返回必须省略分号，才能发挥作用。

显式返回只有在隐式返回不可能时才会使用，因为你要在函数主体结束前返回。虽然上面的每个函数都可以用return关键字和分号来写，但这样做是不必要的冗长，而且与 Rust 代码的惯例不一致。

为什么不推断出函数的签名？

在 Rust 中，声明往往带有明确的类型，而实际代码的类型是推断出来的。这种设计有几个原因：

强制性的声明签名有助于在模块和板块层面上执行接口的稳定性。
签名提高了程序员对代码的理解，消除了 IDE 在整个板块中运行推理算法来猜测一个函数的参数类型的需要；它总是显式的，就在附近。
在机制上，它简化了推理算法，因为推理只需要一次看一个函数。

为什么`match`必须是详尽的?

为了帮助重构和清晰化。

首先，如果每一种可能性都被match所覆盖，那么将来在enum中增加变体将导致编译失败，而不是在运行时出错。这种类型的编译器帮助使得 Rust 中的无畏重构成为可能。

其次，穷举式检查使默认情况的语义变得明确：一般来说，非穷举式match的唯一安全方式是在没有匹配到任何东西时让线程恐慌。Rust 的早期版本并不要求match情况是详尽的，而且发现它是一个很大的 bug 来源。

通过使用_通配符，可以很容易地忽略所有未指定的情况。

match val.do_something() {
    Cat(a) => { /* ... */ }
    _ => { /* ... */ }
}

Numerics

对于浮点运算，我应该选择`f32`和`f64`中的哪一个?

选择哪种方式取决于程序的目的。

如果你对浮点数的最大精度感兴趣, 那么就选择f64. 如果你对保持数值的大小或最大的效率更感兴趣，并且不关心每个数值的位数较少所带来的误差，那么f32更好。对f32的操作通常更快，即使是在 64 位硬件上。作为一个常见的例子，图形编程通常使用f32，因为它需要高性能，而 32 位浮点数足以代表屏幕上的像素。

如果有疑问，可以选择f64以获得更大的精度。

为什么我不能比较浮点数或用它们作为`HashMap`或`BTreeMap`的键?

浮点数可以用==, !=, <, <=, >, 和>=运算符，以及partial_cmp()函数进行比较。==和！=是PartialEq特性的一部分，而<、<=、>、>=和partial_cmp()是PartialOrd 特性的一部分。

浮点数不能用cmp()函数进行比较，它是Ord特性的一部分，因为浮点数没有总排序。此外，浮点数没有全等关系，所以它们也没有实现Eq特性。

由于浮点数NaN不小于、大于或等于任何其他浮点数或其本身，所以浮点数没有总排序或平等关系。

因为浮点数没有实现Eq或Ord，所以它们不能被用于特质边界需要这些特质的类型，例如BTreeMap或[HashMap]。这一点很重要，因为这些类型假设它们的键提供了一个总排序或总等价关系，否则会出现故障。

有一个crate包装了f32和f64以提供Ord和Eq的实现，这在某些情况下可能很有用。

我如何在数字类型之间进行转换?

有两种方法：as关键字，它为原始类型做简单的转换，以及Into和From特性，它们是为一些类型转换而实现的（你也可以为你自己的类型实现）。Into和From特性只在转换无损的情况下实现，所以例如，f64::from(0f32)会被编译，而f32::from(0f64)不会。另一方面，as将在任何两个原始类型之间进行转换，必要时截断数值。

为什么Rust没有增量和减量运算符?

Preincrement 和 Postincrement（以及与之对应的 Decrement）虽然方便，但也相当复杂。它们需要对计算顺序的了解，并经常导致 C 和 C++ 中的微妙错误和未定义行为。和x = x + 1相比x += 1只是稍微长一点，但不明确。

字符串

如何将一个`String`或`Vec`转换为一个片断(`&str`和`&[T]`)?

通常情况下，你可以在期望有片断的地方传递一个对String或Vec的引用。使用Deref coercions，Strings和Vecs在用&或&mut传递引用时，将自动联合到各自的片上。

在&str和&[T]上实现的方法可以直接访问String和Vec。例如，some_string.trim()可以工作，尽管trim是&str上的方法，而some_string是一个String。

在某些情况下，例如通用代码，有必要进行手动转换。手动转换可以使用切片操作符来实现，像这样。&my_vec[...]。

我如何从`&str`转换到`String`或反过来？

to_string()方法可以将&str转换为String，当你借用一个引用时，String自动转换为&str。这两种情况在下面的例子中都有演示。

fn main() {
    let s = "Jane Doe".to_string();
    say_hello(&s);
}

fn say_hello(name: &str) {
    println! ("Hello {}!", name);
}

两种不同的字符串类型之间有什么区别？

String是一个在堆上分配的 UTF-8 字节的自有缓冲区。可变的String可以被修改，根据需要增加其容量。&str是在其他地方分配的String的一个固定容量的“视图”，如果是从String中引用的片断，通常在堆上，如果是字符串字面，在静态内存中。

&str是由 Rust 语言实现的原始类型，而String是由标准库实现的。

我如何在一个`String`中进行 O(1) 的字符访问?

你不能。至少在你不清楚“字符”是什么意思的情况下，以及在对字符串进行预处理以找到所需字符的索引的情况下是不行的。

Rust 字符串是 UTF-8 编码的。UTF-8 中的单个视觉字符不一定是一个字节，因为它在 ASCII 编码的字符串中是一个字节。每个字节被称为“代码单元”（在 UTF-16 中，代码单元是 2 个字节；在 UTF-32 中是4个字节）。“代码点”由一个或多个代码单元组成，并组合成最接近于字符的“字素群”。

因此，即使你可以对 UTF-8 字符串中的字节进行索引，你也无法在恒定时间内访问第 i 个码位或字母群。然而，如果你知道所需的码位或字形群从哪个字节开始，那么你就可以在恒定时间内访问它。包括str::find()和 regex 匹配在内的函数都会返回字节索引，以方便这种访问。

为什么字符串默认为 UTF-8？

str类型是 UTF-8，因为我们在野外观察到更多的文本是用这种编码的–特别是在网络传输中，它是 endian-agnostic 的–而且我们认为最好不要让 I/O 的默认处理涉及到在每个方向重新编码代码点。

这确实意味着在一个字符串中定位一个特定的 Unicode 编码点是一个 O(n) 操作，尽管如果开始的字节索引已经知道，那么它们可以在 O(1) 中被访问。一方面，这显然是不可取的；另一方面，这个问题充满了权衡，我们想指出几个重要的限定条件。

扫描一个str的 ASCII 范围的代码点仍然可以安全地逐个字节地进行。如果你使用.as_bytes()，取出一个u8只需花费O(1)，并产生一个可以被转换并与 ASCII 范围的char比较的值。因此，如果你（比如）在\n上断行，基于字节的处理方法仍然有效。UTF-8 就是这样被精心设计的。

大多数“面向字符”的文本操作只有在非常有限的语言假设下才能工作，如“仅 ASCII 范围的代码点”。在 ASCII 范围之外，你往往不得不使用复杂的（非恒定时间）算法来确定语言单位（字形、单词、段落）的边界。我们建议使用一种“诚实的”具有语言意识的、经 Unicode 批准的算法。

char类型是 UTF-32。如果你确定你需要做一个代码点的算法，写一个type wstr = [char]，并将一个str一次性解压到其中，然后用wstr工作，这是非常容易的。换句话说：如果你需要使用这种编码，语言没有默认解码为 UTF32的事实不应该阻止你解码（或以任何其他方式重新编码）。

关于为什么 UTF-8 通常比 UTF-16 或 UTF-32 更受欢迎，请阅读 UTF-8 Everywhere 宣言。

我应该使用什么字符串类型？

Rust 有四对字符串类型，每一对都有不同的用途。在每一对中，都有一个“自有”的字符串类型，和一个“分片”的字符串类型。这个组织看起来像这样。

	“Slice” type	“Owned” type
UTF-8	`str`	`String`
OS-compatible	`OsStr`	`OsString`
C-compatible	`CStr`	`CString`
System path	`Path`	`PathBuf`

Rust 的不同字符串类型有不同的用途。String和str是 UTF-8 编码的通用字符串。OsString和OsStr是根据当前平台编码的，在与操作系统交互时使用。CString和CStr相当于C 语言中的字符串，在 FFI 代码中使用。PathBuf和Path是对OsString和OsStr的方便包装，提供特定于路径操作的方法。

我怎样才能写一个既接受`&str`又接受`String`的函数?

有几种选择，取决于函数的需要。

如果函数需要一个自有的字符串，但又想接受任何类型的字符串，可以使用一个Into绑定。
如果函数需要一个字符串分片，但希望接受任何类型的字符串，使用AsRef绑定。
如果函数不关心字符串的类型，而想统一处理这两种可能性，使用Cow作为输入类型。

使用`Into`

在这个例子中，该函数将同时接受自有字符串和字符串片，要么不做任何事情，要么在函数主体内将输入的字符串转换为自有字符串。注意，转换需要明确进行，否则不会发生。

fn accepts_bothInto<String>>(s: S) {
    let s = s.into(); // 这将把 s 转换成一个`String`。
    // ... 其余的函数
}

使用`AsRef`

在这个例子中，该函数将接受拥有的字符串和字符串片断，要么不做任何事情，要么将输入的字符串片断转换为字符串。这可以通过引用输入来自动完成，像这样。

1
2
3

fn accepts_bothAsRef<str>>(s: &S) {
    // ... 该函数的主体
}

使用`Cow`

在这个例子中，函数接收了一个Cow，它不是一个通用类型，而是一个容器，根据需要包含一个自有的字符串或字符串片断。

1
2
3

fn accepts_cow(s: Cow<str>) {
    // ... 该函数的主体
}

集合

我可以在 Rust 中有效地实现向量和链表等数据结构吗?

如果你实现这些数据结构的原因是为了在其他程序中使用它们，那就没有必要了，因为这些数据结构的有效实现已经由标准库提供了。

然而，如果你的理由只是为了学习，那么你很可能需要涉足不安全代码。虽然这些数据结构可以完全用安全的 Rust 来实现，但其性能可能会比使用不安全的代码要差。原因很简单，向量和链接列表等数据结构依赖于指针和内存操作，而这些操作在安全 Rust 中是不允许的。

例如，一个双链接列表需要对每个节点有两个可变引用，但这违反了 Rust 的可变引用别名规则。你可以用Weak来解决这个问题，但是性能会比你想要的差。使用不安全的代码，你可以绕过可变引用别名规则的限制，但必须手动验证你的代码是否引入了内存安全违规。

我怎样才能在不移动/消耗集合的情况下对其进行迭代？

最简单的方法是通过使用集合的IntoIterator实现。下面是一个关于&Vec的例子。

let v = vec! [1,2,3,4,5];
for item in &v {
    print! ("{} ", item);
}
println! ("\nLength: {}", v.len());

Rust 的for循环对它们要迭代的东西调用into_iter()（定义在IntoIteratortrait 上）。任何实现了IntoIteratortrait 的东西都可以用for循环进行循环。IntoIterator是为&Vec和&mut Vec实现的，导致来自into_iter()的迭代器借用集合的内容，而不是移动/消费它们。这对其他标准集合也是如此。

如果需要一个移动/消耗的迭代器，编写for循环时不要在迭代中使用&或&mut。

如果你需要直接访问一个借用的迭代器，你通常可以通过调用iter()方法得到它。

为什么我需要在数组声明中输入数组大小?

你不一定要这样做。如果你直接声明一个数组，大小是根据元素的数量推断出来的。但是如果你声明的是一个接收固定大小的数组的函数，编译器就必须知道这个数组有多大。

有一点需要注意的是，目前 Rust 并没有对不同大小的数组提供泛型。如果你想接受一个连续的可变数量的值的容器，使用Vec或 slice（取决于你是否需要所有权）。

所有权

我怎样才能实现一个包含环的图或其他数据结构?

至少有四种选择（在Too Many Linked Lists中详细讨论过）。

你可以使用Rc和Weak实现它，以允许节点的共享所有权。尽管这种方法需要付出内存管理的代价。
你可以使用“不安全”的代码实现它，使用原始指针。这将更加高效，但却绕过了 Rust 的安全保证。
使用向量和这些向量的索引。有几个可用这种方法的例子和解释。
用UnsafeCell使用借用的引用。对于这种方法有解释和代码。

我怎样才能定义一个包含对其自身字段之一的引用的结构？

这是有可能的，但是这样做没有用。该结构会被自己永久借用，因此不能被移动。下面是一些说明这个问题的代码。

use std::cell::Cell;

#[derive(Debug)]
struct Unmovable<'a> {
    x: u32,
    y: Cell<Option<&'a u32>>。
}

fn main() {
    let test = Unmovable { x: 42, y: Cell::new(None) }。
    test.y.set(Some(&test.x))。

    println! ("{:?}", test);
}

按值传递、消耗、移动和转移所有权之间有什么区别?

这些是同一事物的不同术语。在所有的情况下，这意味着值已经被转移到另一个所有者那里，并且脱离了原所有者的占有，原所有者不能再使用它。如果一个类型实现了Copy特性，那么原所有者的值就不会被废止，仍然可以使用。

为什么某些类型的值在传递给一个函数后可以使用，而重复使用其他类型的值会导致错误？

如果一个类型实现了Copy特性，那么它在传递给函数时就会被复制。Rust 中的所有数字类型都实现了Copy，但结构类型默认不实现Copy，所以它们被移动。这意味着该结构不能再被用于其他地方，除非通过返回将其移回函数之外。

如何处理“use of moved value”的错误？

这个错误意味着你要使用的值已经被转移到一个新的所有者那里。首先要检查的是有关的移动是否是必要的：如果它移动到一个函数中，也许可以重写该函数以使用一个引用，而不是移动。否则，如果被移动的类型实现了Clone，那么在移动前对其调用clone()将移动它的一个副本，留下原始的仍然可以继续使用。但是请注意，克隆一个值通常应该是最后的手段，因为克隆可能很昂贵，会导致进一步的分配。

如果移动的值是你自己的自定义类型，考虑实现Copy（用于隐式复制，而不是移动）或Clone（显式复制）。Copy最常用的实现方式是#[derive(Copy, Clone)]（Copy需要Clone），而Clone则是`#[derive(Clone)]。

如果这些都不可能，你可能想修改获得所有权的函数，以便在函数退出时返回数值的所有权。

在方法声明中使用`self`、`&self`或`&mut self`的规则是什么?

当一个函数需要消耗值的时候，使用self。
当一个函数只需要一个对值的只读引用时，使用&self。
当一个函数需要在不消耗该值的情况下改变该值时，使用&mut self。

我怎样才能理解借用检查器？

借用检查器在评估 Rust 代码时只应用一些规则，这些规则可以在 Rust 书的借用部分中找到。这些规则是：

首先，任何借用必须持续的范围不大于所有者的范围。第二，你可以有这两种借用中的一种或另一种，但不能同时存在：
对一个资源的一个或多个引用（&T）。
一个可变的引用（&mut T）。

虽然这些规则本身很简单，但持续地遵守这些规则并不容易，特别是对于那些不习惯推理寿命和所有权的人来说。

了解借用检查器的第一步是阅读它产生的错误。为了确保借用检查器在解决它所发现的问题方面提供高质量的帮助，我们做了大量的工作。当你遇到借用检查器的问题时，第一步是慢慢地、仔细地阅读所报告的错误，只有在理解了所描述的错误之后，才能接近代码。

第二步是熟悉 Rust 标准库提供的所有权和可变性相关的容器类型，包括Cell、RefCell和Cow。这些都是表达某些所有权和可变性情况的有用和必要的工具，并且被写成性能代价最小。

理解借用检查器最重要的一个部分是实践。Rust 的强静态分析保证是严格的，与许多程序员之前的工作有很大不同。需要一些时间才能完全适应一切。

如果你发现自己在借用检查器上挣扎，或者没有耐心了，请随时联系 Rust 社区寻求帮助。

什么时候`Rc`有用？

这在Rc的官方文档中有所涉及，Rust 的非原子引用计算的指针类型。简而言之，Rc和它的线程安全表亲Arc对于表达共享所有权是很有用的，当没有人访问相关内存时，系统会自动将其取消。

我如何从一个函数中返回一个闭包？

要从一个函数中返回一个闭包，它必须是一个“移动闭包”，也就是说，闭包是用move关键字声明的。正如 Rust 书中所解释的，这使得闭包拥有自己的捕获变量的副本，独立于其父级堆栈框架。否则，返回一个闭包将是不安全的，因为它将允许访问不再有效的变量；换句话说：它将允许读取可能无效的内存。闭包还必须被包裹在一个Box中，这样它就被分配在堆上。阅读更多关于这个的内容在书中。

什么是 deref coercion，它是如何工作的？

deref coercion 是一个很方便的 coercion。自动将对指针的引用(例如, &Rc 或 &Box)转换为对其内容的引用（例如，&T）。Deref coercion 的存在是为了使 Rust 的使用更符合人体工程学，并通过Deref特性实现。

Deref 的实现表明实现类型可以通过调用deref方法转换为目标类型，该方法接收对调用类型的不可变的引用，并返回对目标类型的引用（具有相同的生命周期）。*前缀操作符是deref方法的简写。

它们被称“coercions”，因为下面的规则，这里引用了 Rust 书。

如果你有一个类型U，并且它实现了Deref，那么&U的值将自动被强制为T。

例如，如果你有一个&Rc，它将通过这个规则联合成一个&String，然后以同样的方式联合成一个&str。因此，如果一个函数需要一个&str参数，你可以直接传入一个&Rc，所有的强制都通过Deref特性自动处理。

最常见的 Derefcoercions 种类是：

&Rc到&T。
&Box到&T。
&Arc到&T。
&Vec改为&[T]。
&String改为&str。

生命周期

为什么是生命周期?

生命周期是 Rust 对内存安全问题的回答。它允许 Rust 确保内存安全而不需要付出垃圾回收的性能代价。它们是基于各种学术工作的。

为什么生命周期的语法是这样的？

'a语法来自于 ML 系列编程语言，其中'a用于表示一个通用类型参数。对于 Rust 来说，这种语法必须是明确的、明显的，并且适合在类型声明中与 traits 和 reference 一起使用。其他的语法已经被讨论过了，但是还没有其他的语法被证明是更好的。

我如何将一个借来的东西返回到我从函数中创建的东西？

你需要确保借来的东西会超过函数的寿命。这可以通过将输出寿命与一些输入寿命绑定来实现，比如说。

type Pool = TypedArena;

// 下面的生命周期只是为了说明问题而明确写的；它可以通过后面描述的删除规则省略。
fn create_borrowed<'a>(pool: &'a Pool,
                       x: i32,
                       y: i32) -> &'a Thing {
    pool.alloc(Thing { x: x, y: y })
}

另一种方法是通过返回一个自有类型如String来完全消除引用。

1
2
3

fn happy_birthday(name: &str, age: i64) -> String {
    format! ("Hello {}! You're {} years old!", name, age)
}

这种方法比较简单，但往往会导致不必要的分配。

为什么有些引用有寿命，如`&'a T`，而有些则没有，如`&T`？

事实上, 所有引用类型都有一个寿命, 但大多数时候你不必明确写出
它是明确的。规则如下。

在一个函数体中，你永远不需要明确地写出生命周期；正确的值应该总是被推断出来的。
在一个函数的签名中（例如，在其参数的类型或其返回类型中），你可能会需要写一个生命周期。这里的生命周期使用一个简单的默认方案，称为“lifetime elision”。它由以下三条规则组成：
- 在一个函数的参数中，每一个被省略的生命周期都成为一个独立的生命周期参数。
- 如果正好只有一个输入生命周期，无论是否被省略，该生命周期都被分配给所有返回值中被省略的生命周期。
- 如果有多个输入生命周期，但其中一个是 &self 或 &mut self，那么 self 的生命周期将被分配给所有被忽略的返回生命周期。
最后，在“结构”或“枚举”的定义中，所有的生命周期必须被明确地声明。

如果这些规则导致了编译错误，Rust 编译器将提供一个错误信息，指出所造成的错误，并根据推理过程的哪一步造成的错误，提出一个潜在的解决方案。

Rust如何保证“没有空指针”和“没有悬空指针”?

构造一个&Foo或&mut Foo类型的值的唯一方法是指定一个引用所指向的Foo类型的现有值。引用在给定的代码区域内（引用的生命周期）“借用”原始值，在借用期间，被借用的值不能被移动或销毁。

我如何用“null”来表达一个值的缺失?

你可以用Option类型来做，它可以是Some(T)或None。Some(T)表示其中包含一个T类型的值，而None表示没有值。

泛型

什么是“单态化”?

单态化是将泛型函数（或结构）的每一次使用都基于调用该函数（或使用该结构）的参数类型用特定的实例进行单态化。

在单态化过程中，泛型函数的一个新副本被翻译为该函数实例化的每一组独特类型。这与 C++ 使用的策略相同。它的结果是为每个调用点专门设计的快速代码，并且是静态调度的，其代价是用许多不同类型实例化的函数会导致“代码膨胀”，即多个函数实例会导致比用其他翻译策略创建的二进制文件更大。

接受 Trait Object 而不是类型参数的函数不进行单态化。相反，特质对象上的方法在运行时被动态地分配。

一个函数和一个没有捕获任何变量的闭包之间有什么区别？

函数和闭包在操作上是等价的，但由于它们的实现方式不同，所以有不同的运行时表示。

函数是语言的内置基元，而闭包本质上是三种特征之一的语法糖。Fn, FnMut, 和 FnOnce。当你创建一个闭包时，Rust 编译器会自动创建一个结构，实现这三个结构的相应特性，并将捕获的环境变量作为成员，并使该结构可以作为一个函数被调用。裸露的函数不能捕获环境。

这些特征之间的最大区别是它们如何接受“self”参数。Fn使用&self，FnMut使用&mut self，而FnOnce使用self。

即使一个闭包没有捕获任何环境变量，它在运行时也被表示为两个指针，与其他闭包相同。

什么是高阶类型，为什么我需要它们，以及为什么 Rust 没有它们？

高等类型是指具有未填充参数的类型。类型构造器，如Vec，Result，和HashMap都是高类型类型的例子：每个类型都需要一些额外的类型参数，以便实际表示一个特定的类型，如Vec。对高类型的支持意味着这些“不完整”的类型可以在任何可以使用“完整”类型的地方使用，包括作为函数的泛型。

任何完整的类型，像i32，bool或char都属于*类型（这个符号来自类型理论领域）。一个有一个参数的类型，像Vec是属于* -> *，意思是Vec接收一个完整的类型，像i32，并返回一个完整类型Vec。一个有三个参数的类型，如HashMap是一种* -> * -> * -> *，并接收三个完整的类型（如i32，String，和RandomState），产生一个新的完整类型HashMap。

除了这些例子之外，类型构造函数还可以接受生命周期参数，我们将其表示为Lt。例如，slice::Iter的种类是Lt -> * -> *，因为它必须像Iter<'a, u32>一样被实例化。

由于缺乏对高阶类型的支持，因此很难编写某些类型的通用代码。对于像迭代器这样的概念的抽象来说，这尤其成问题，因为迭代器通常至少要在一个生命周期内进行参数化。这反过来又阻碍了对 Rust 的集合进行抽象的 traits 的创建。

另一个常见的例子是像 functors 或 monads 这样的概念，它们都是类型构造函数，而不是单一类型。

Rust 目前并不支持高类型的类型，因为与我们想做的其他改进相比，这并不是一个优先事项。由于该设计是一个重大的、跨领域的变化，我们也想谨慎地对待它。但是目前缺乏支持并没有什么内在的原因。

通用类型中像这样的命名类型参数是什么意思?

这些被称为关联类型，它们允许表达不能用where子句表达的特征边界。例如，一个泛型约束X: Bar意味着”X必须实现 trait Bar，在Bar的实现中，X必须选择Foo作为Bar的关联类型T“。这种约束不能通过where子句来表达的例子包括像Box>这样的 trait object。

关联类型的存在是因为泛型经常涉及类型家族，其中一个类型决定了一个家族中的所有其他类型。例如，一个图的 trait 可能将图本身作为其Self类型，并有节点和边的关联类型。每个图的类型唯一地决定了相关的类型。使用关联类型使这些类型族的工作更加简洁，并且在许多情况下提供更好的类型推理。

我可以重载运算符吗? 哪些操作符，如何操作？

你可以使用它们的关联特性为各种运算符提供自定义的实现。Add代表+，Mul代表*，等等。它看起来像这样。

use std::ops::Add。

struct Foo;

impl Add for Foo {
    type Output = Foo;
    fn add(self, rhs: Foo) -> Self::Output {
        println!("Adding!");
        self
    }
}

以下操作符可以被重载。

Operation	Trait
`+`	`Add`
`+=`	`AddAssign`
`binary -`	`Sub`
`-=`	`SubAssign`
`*`	`Mul`
`*=`	`MulAssign`
`/`	`Div`
`/=`	`DivAssign`
`unary -`	`Neg`
`%`	`Rem`
`%=`	`RemAssign`
`&`	`BitAnd`
`&=`	`BitAndAssign`
`\|`	`BitOr`
`\|=`	`BitOrAssign`
`^`	`BitXor`
`^=`	`BitXorAssign`
`!`	`Not`
`<<`	`Shl`
`<<=`	`ShlAssign`
`>>`	`Shr`
`>>=`	`ShrAssign`
`*`	`Deref`
`mut *`	`DerefMut`
`[]`	`Index`
`mut []`	`IndexMut`

为什么要在`Eq`/`PartialEq`和`Ord`/`PartialOrd`之间划分？

在 Rust 中，有一些类型的值只有部分排序，或者只有部分相等。部分排序的意思是，在给定的类型中可能存在既不小于也不大于对方的值。部分平等意味着可能有给定类型的值不等于自己。

浮点类型（f32和f64）是每种类型的很好的例子。任何浮点类型都可以有NaN（意思是“不是一个数字”）的值。NaN不等于自己（NaN == NaN是 false），也不小于或大于任何其他浮点值。因此，f32和[f64]都实现了PartialOrd和PartialEq，但没有实现Ord和``Eq`]Eq。

正如在先前关于 floats 的问题中解释的那样，这些区别很重要，因为有些集合依赖于总排序/equality，以便给出正确的结果。

输入/输出

如何将一个文件读成一个“字符串”?

使用read_to_string()方法, 这个方法是在std::io中的Read特性上定义。

use std::io::Read;
use std::fs::File;

fn read_file(path: &str) -> Result<String, std::io::Error> {
    let mut s = String::new();
    let _ = File::open(path)?.read_to_string(&mut s);  // `s` contains the contents of "foo.txt"
    Ok(s)
}

fn main() {
    match read_file("foo.txt") {
        Ok(_) => println!("Got file contents!"),
        Err(err) => println!("Getting file contents failed with error: {}", err)
    };
}

如何有效地读取文件输入?

File类型实现了Read特性，它有多种函数用于读写数据，包括read(), read_to_end(), bytes(), chars(), 和take() 。这些函数中的每一个都从一个给定的文件中读取一定量的输入。read() 在一次调用中读取底层系统所能提供的输入量。read_to_end() 将整个缓冲区读入一个向量，需要多少空间就分配多少。bytes()和chars()分别允许你对文件的字节和字符进行迭代。最后，take()允许你从文件中读取任意数量的字节。总的来说，这些应该允许你有效地读入任何你需要的数据。

对于缓冲读取，使用BufReader结构，这有助于减少读取时的系统调用数量。

我如何在 Rust 中进行异步输入/输出？

使用 tokio。

我如何在 Rust 中获得命令行参数?

最简单的方法是使用Args，它提供了一个输入参数的迭代器。

如果你正在寻找更强大的库，在 crates.io 上有一些选项。

错误处理

为什么 Rust 没有异常？

异常使控制流的理解复杂化，它们在类型系统之外表达有效性/无效性，而且它们与多线程代码（Rust 的主要焦点）的互操作性很差。

Rust 更倾向于采用基于类型的错误处理方法，这在书中有详细介绍。这与 Rust 的控制流、并发性和其他一切都更加吻合。

到处都有`unwrap()’是怎么回事?

unwrap()是一个提取Option或Result里面的值的函数，如果没有值就会 panic。

unwrap()不应该是你处理预期出现的错误的默认方式，例如用户输入不正确。在生产代码中，它应该被视为一个断言，即该值是非空的，如果违反，将使程序崩溃。

它对快速原型也很有用，在那里你还不想处理错误，或者在博客文章中，错误处理会分散对重点的注意力。

当我试图运行使用`try!`宏的示例代码时，为什么我得到一个错误?

这可能是函数的返回类型的问题。try!宏要么从Result中提取数值，要么提前返回，错误是Result携带的。这意味着try只对返回Result本身的函数有效，其中Err构造的类型实现了From::from(err)。特别是，这意味着try!宏不能在main函数中工作。

有没有比到处都是“Result”更简单的方法来做错误处理？

如果你正在寻找一种方法来避免在其他人的代码中处理Result，总是有unwrap()，但这可能不是你想要的。Result是一个指标，表明某些计算可能会或可能不会成功完成。要求你明确地处理这些失败是 Rust 鼓励健壮性的方式之一。Rust 提供了像try!宏这样的工具，使处理失败的过程符合人体工程学。

如果你真的不想处理错误，可以使用unwrap()，但要知道，这样做意味着代码在失败时 panic，这通常会导致关闭进程。

并发

我可以在没有“不安全”块的情况下跨线程使用静态值吗？

如果是同步的，修改是安全的。修改一个静态的Mutex（通过lazy-static crate 懒惰地初始化）不需要一个unsafe块，修改一个静态的AtomicUsize（可以不用 lazy_static 初始化）也是如此。

更一般地说，如果一个类型实现了Sync，并且没有实现Drop，它可以在static中使用。

宏

我可以写一个宏来生成标识符吗?

目前不能。Rust 的宏是“卫生宏”，它有意避免捕捉或创建可能与其他标识符发生意外碰撞的标识符。它们的功能与通常与 C 预处理器相关的宏的风格明显不同。宏调用只能出现在被明确支持的地方：项目、方法声明、语句、表达式和模式。这里，“方法声明”指的是可以放置方法的空白处。它们不能被用来完成部分方法声明。按照同样的逻辑，它们也不能用来完成一个部分变量声明。

Debugging and Tooling

我如何调试 Rust 程序？

Rust 程序可以使用 gdb 或 lldb 进行调试，与 C 和 C++ 相同。事实上，每一个 Rust 的安装都带有 rust-gdb 和 rust-lldb 中的一个或两个（取决于平台支持）。这些是对 gdb 和 lldb 的封装，并启用了 Rust pretty-printing。

`rustc`说标准库代码中发生了 panic。我如何定位我的代码中的错误？

这个错误通常是由客户端代码中unwrap()ing一个None或Err引起的。通过设置环境变量RUST_BACKTRACE=1来启用回溯，有助于获得更多信息。在调试模式下编译（默认为“cargo build”）也有帮助。使用调试器，如提供的rust-gdb或rust-lldb也很有帮助。

我应该使用什么 IDE？

Rust 的开发环境有很多选择，所有这些都在非官方的 IDE 支持页面上有详细说明。

Low-Level

我怎样才能`memcpy`字节?

如果你想安全地克隆一个现有的分片，你可以使用clone_from_slice。

要复制可能重叠的字节，使用copy。要复制不重叠的字节，使用copy_nonoverlapping。这两个函数都是“不安全”的，因为它们都可以被用来破坏语言的安全保证。在使用它们时要注意。

没有标准库，Rust 能合理地运行吗？

当然可以。Rust 程序可以使用#![no_std]属性设置为不加载标准库。设置了这个属性后，你可以继续使用 Rust 核心库，它只是平台无关的原语。因此，它不包括 IO、并发性、堆分配等。

我可以用 Rust 写一个操作系统吗？

是的！事实上，有几个正在进行的项目就是这样。

我如何在文件或其他字节流中以大数或小数格式读写数字类型如`i32`或`f64`?

你应该看看 byteorder crate，它提供了相应的实用程序。

Rust 是否保证一个特定的数据布局？

默认情况下不是。在一般情况下，enum和struct的布局是未定义的。这允许编译器进行潜在的优化，比如为判别式重新使用填充物，压缩嵌套的enum的变体，重新排序字段以移除填充物，等等。不携带数据的enum（“C-like”）有资格拥有一个定义的表示。这种枚举很容易区分，因为它们只是一个没有数据的名字列表。

snum CLike {
    A,
    B = 32,
    C = 34,
    D
}

＃[repr(C)]属性可以应用于这些“enum”，使它们在同等的 C 代码中具有相同的表示。这允许在 FFI 代码中使用 Rust 的“enum”，而在大多数情况下也使用 C 的“enum”。该属性也可以应用于struct，以获得与C struct相同的布局。

跨平台

在 Rust 中表达特定平台行为的习惯性方法是什么？

平台特定行为可以用条件编译属性来表达，如target_os, target_family, target_endian，等等。

Rust 可以用于 Android/iOS 编程吗？

是的，它可以! 在 Android和 iOS 中都已经有使用 Rust 的例子。它确实需要一些工作来设置，但 Rust 在这两个平台上的功能都很好。

我可以在网络浏览器中运行我的 Rust 程序吗？

有可能。Rust 对asm.js和WebAssembly都有实验性支持。

我如何在 Rust 中进行交叉编译？

在 Rust 中可以进行交叉编译，但需要一点工作来设置。每个 Rust 编译器都是一个交叉编译器，但是库需要针对目标平台进行交叉编译。

Rust 确实为每个支持的平台分发了标准库的副本，这些副本包含在分发页面上找到的每个构建目录的rust-std-*文件中，但目前还没有自动安装的方法。

mod 和 crate

mod 和 crate 之间的关系是什么？

crate 是一个编译单元，它是 Rust 编译器可以操作的最小的代码量。
mod 是 crate 内的一个（可能是嵌套的）代码组织单元。
一个 crate 包含一个隐含的、未命名的顶层 mod。
递归定义可以跨越 mod，但不能跨越 crate。

为什么 Rust 编译器找不到我正在`使用`的这个库?

有很多可能的答案，但一个常见的错误是没有意识到use声明是相对于 crate root 的。试着改写你的声明，使用它们在你的项目根文件中定义的路径，看看是否能解决这个问题。

还有“self”和“super”，它们分别将“use”路径区分为相对于当前 mod 或父 mod。

关于use库的完整信息，请阅读 Rust 书中的“Packages, Crates, and Modules”一章。

为什么我必须在 crate 的顶层用`mod`声明 mod 文件，而不是直接`use`它们？

在 Rust 中，有两种方法来声明模块，内联或在另一个文件中。下面是各自的一个例子。

// In main.rs
mod hello {
    pub fn f() {
        println!("hello!");
    }
}

fn main() {
    hello::f();
}

// In main.rs
mod hello;

fn main() {
    hello::f();
}

// In hello.rs
pub fn f() {
    println!("hello!");
}

在第一个例子中，模块被定义在它所使用的同一文件中。在第二个例子中，主文件中的模块声明告诉编译器寻找hello.rs或hello/mod.rs，并加载该文件。

注意mod和use之间的区别：mod声明一个模块的存在，而use引用一个在其他地方声明的模块，将其内容纳入当前模块的范围。

我如何配置 Cargo 使用代理？

参考 https://rsproxy.cn/。

为什么我已经“use”了 crate，但编译器还是找不到方法的实现？

对于定义在 trait 上的方法，你必须明确导入 trait 声明。这意味着仅仅导入一个结构实现 trait 的模块是不够的，你还必须导入 trait 本身。

为什么编译器不能为我推断出`use`声明？

它可能可以，但你也不希望它这样做。虽然在很多情况下，编译器有可能通过简单地寻找给定标识符的定义位置来确定导入的正确模块，但在一般情况下可能不是这样的。rustc中任何用于选择竞争性选项的决策规则，在某些情况下可能会引起惊讶和混乱，Rust 更倾向于明确说明名称的来源。

例如，编译器可以说，在标识符定义相互竞争的情况下，会选择最早导入的模块的定义。所以如果模块foo和模块bar都定义了标识符baz，但是foo是第一个注册的模块，编译器会插入use foo::baz;。

mod foo;
mod bar;

// use foo::baz  // to be inserted by the compiler.

fn main() {
  baz();
}

如果你知道这种情况会发生，也许它可以节省少量的按键，但它也大大增加了当你真正想把baz()变成bar::baz()时出现令人惊讶的错误信息的可能性，而且它通过使函数调用的意义依赖于模块声明而降低了代码的可读性。这些都是我们不愿意做的折衷。

然而，IDE 可以帮助管理声明，这将给你带来两方面的好处：机器协助拉入名字，但明确声明这些名字的来源。

我如何进行动态 Rust 库加载？

用 libloading 导入 Rust 中的动态库，它提供了一个跨平台的动态链接系统。

为什么 crates.io 没有命名空间？

引用 crates.io 设计的官方解释：

在使用 crates.io 的第一个月里，很多人问我们是否有可能引入命名空间。
虽然 namespace 允许多个作者使用单一的、通用的名称，但它们增加了包在 Rust 代码中的引用和人类对包的交流的复杂性。乍一看，它们允许多个作者使用“http”这样的名字，但这仅仅意味着人们需要将这些包称为“wycats’http”或“reem’http”，与“wycats-http”或“reem-http”这样的包名相比没有什么好处。
当我们研究没有命名空间的软件包生态系统时，我们发现人们倾向于使用更有创意的名字（如nokogiri而不是tenderlove's libxml2）。这些有创意的名字往往简短易记，部分原因是缺乏任何层次结构。它们使人们更容易简洁明了地交流软件包。他们创造了令人兴奋的品牌。我们已经看到了一些 10,000+ 软件包生态系统的成功，如 NPM 和 RubyGems，它们的社区在一个单一的命名空间内蓬勃发展。
简而言之，我们认为如果 Piston 选择bvssvni/game-engine这样的名字（允许其他用户选择wycats/game-engine）而不是简单的piston，那么 Cargo 的生态系统就不会好转。
因为命名空间在很多方面严格来说都比较复杂，而且如果将来有必要的话，还可以兼容添加，所以我们要坚持使用单一的共享命名空间。

库

我怎样才能发出 HTTP 请求?

标准库不包括 HTTP 的实现，所以你要使用一个外部的 crate。
reqwest 是最简单的。它建立在hyper上，用 Rust 编写，但也有一些其他的。curl crate 被广泛使用，它提供了与 curl 库的绑定。

我如何用 Rust 编写 GUI 应用程序？

有多种方法可以在 Rust 中编写 GUI 应用程序。只要看看这个 GUI 框架的列表。

我怎样才能解析 JSON/XML?

Serde是推荐的 Rust 数据序列化和反序列化的库，可以从许多不同的格式中获取。

是否有一个标准的 2D+ 矢量和形状 crate?

还没有! 想写一个吗？

我如何在 Rust 中编写一个 OpenGL 应用程序?

Glium 是 Rust 中 OpenGL 编程的主要库。GLFW 也是一个可靠的选择。

我可以用 Rust 写一个视频游戏吗？

是的，你可以。Rust 的主要游戏编程库是Piston，而且还有一个 Rust 游戏编程的 subreddit 和一个 IRC 频道（#rust-gamedev on Mozilla IRC）。

设计模式

Rust是面向对象的吗？

它是多范式的。很多在 OO 语言中可以做的事情在 Rust 中也可以做，但不是所有的事情，也不总是使用你所习惯的那种抽象方式。

我如何将面向对象的概念映射到 Rust 中？

这取决于。有一些方法可以将面向对象的概念，如多重继承翻译成 Rust，但由于 Rust 不是面向对象的，所以翻译的结果可能与它在 OO 语言中的外观有很大不同。

我如何处理带有可选参数的结构的配置？

最简单的方法是在你用来构建结构实例的任何函数中使用Option类型（通常是new()）。另一种方法是使用构建器模式，在构建所构建的类型之前，只必须调用某些实例化成员变量的函数。

我如何在 Rust 中做全局变量?

Rust 中的全局变量可以使用const声明来实现编译时计算的全局常量，而static可以用来实现可变的全局变量。请注意，修改static mut变量需要使用unsafe，因为它允许数据竞争，而在安全的 Rust 中保证不会发生这种情况。const和static值之间的一个重要区别是，你可以对static值进行引用，但不能对const值进行引用，后者没有指定的内存位置。关于const与static的更多信息，请阅读 Rust 书。

我如何设置程序化定义的编译时常量？

Rust 目前对编译时常量的支持有限。你可以使用“const”声明来定义基元（类似于“static”，但是是不可变的，在内存中没有指定的位置），也可以定义“const”函数和固有方法。

要定义不能通过这些机制定义的程序性常量，可以使用lazy-static crate，它通过在第一次使用时自动计算常量来模拟编译时计算。

我可以运行发生在 main 之前的初始化代码吗？

Rust 没有“在main之前的生命”的概念。最接近的是通过lazy-static crate 来完成，它通过在静态变量第一次使用时懒散地初始化静态变量来模拟“main之前”。

Rust 允许 globals 使用非结构表达式的值吗？

不允许。全局变量不能有一个非结构表达式的构造函数，也不能有一个析构函数。静态构造函数是不可取的，因为确保静态初始化顺序的可移植性是很困难的。main 之前的生命通常被认为是一个错误的功能，所以 Rust 不允许它。

参见 C++ FQA 中关于“静态初始化顺序惨败”的内容，以及 Eric Lippert 的博客中关于 C# 的挑战，它也有这种特性。

你可以用 lazy-static 工具箱来近似非内容表达式的 globals。

其他语言

我怎样才能在 Rust 中实现类似 C 语言的`struct X { static int X; };`的东西呢？

Rust 没有上面代码片断中所示的静态字段。相反，你可以在一个给定的模块中声明一个静态变量，这个变量对该模块是私有的。

我如何将 C 风格的枚举转换为整数，反之亦然？

将 C 风格的枚举转换为整数可以用as表达式来完成，比如e as i64(其中e是某个枚举)。

另一个方向的转换可以用match语句来完成, 它将不同的数字值映射到枚举的不同潜在值上.

为什么 Rust 程序的二进制大小比 C 程序大?

有几个因素导致 Rust 程序默认比功能相当的 C 程序有较大的二进制大小。一般来说，Rust 更倾向于对现实世界的程序性能进行优化，而不是对小程序的大小进行优化。

单态化

Rust 对泛型进行了单态化处理，这意味着在程序中每使用一个具体类型，就会生成一个新的泛型函数或类型。这类似于 C++ 中模板的工作方式。例如，在下面的程序中：

fn foo(t: T) {
    // ... do something
}

fn main() {
    foo(10);       // i32
    foo("hello");  // &str
}

两个不同版本的foo将出现在最终的二进制文件中，一个专门用于i32输入，一个专门用于&str输入。这使得通用函数的静态调度更加有效，但代价是一个更大的二进制文件。

调试符号

Rust 程序在编译时保留了一些调试符号，即使是在 release 模式下编译。这些符号用于提供 panic 时的 backtrace，可以用strip或其他调试符号移除工具移除。值得注意的是，用 Cargo 在 release 模式下编译，相当于用 rustc 设置优化级别 3。另一个优化级别（称为s或z）已被添加，它告诉编译器为大小而不是性能进行优化。

链接时优化

Rust 默认不做链接时优化，但可以被指示这样做。这增加了 Rust 编译器可能做的优化量，并对二进制的大小有小的影响。与之前提到的尺寸优化模式相结合，这种影响可能更大。

标准库

Rust 标准库包括 libbacktrace 和 libunwind，这在某些程序中可能是不可取的。因此，使用#![no_std]可以带来更小的二进制文件，但通常也会对你正在编写的那种 Rust 代码造成实质性的改变。请注意，在没有标准库的情况下使用 Rust，通常在功能上更接近于同等的 C 代码。

举个例子，下面的 C 程序读入一个名字，并对有这个名字的人说“你好”。

#include 

int main(void) {
    printf("What's your name?\n");
    char input[100] = {0};
    scanf("%s", input);
    printf("Hello %s!\n", input);
    return 0;
}

用Rust重写这个，你可能会得到如下的东西。

use std::io;

fn main() {
    println!("What's your name?");
    let mut input = String::new();
    io::stdin().read_line(&mut input).unwrap();
    println!("Hello {}!", input);
}

这个程序在编译后与 C 程序相比，会有更大的二进制，使用更多的内存。但是这个程序并不完全等同于上面的 C 代码。等价的 Rust 代码反而会是这样的。

#![feature(lang_items)]
#![feature(libc)]
#![feature(no_std)]
#![feature(start)]
#![no_std]

extern crate libc;

extern "C" {
    fn printf(fmt: *const u8, ...) -> i32;
    fn scanf(fmt: *const u8, ...) -> i32;
}

#[start]
fn start(_argc: isize, _argv: *const *const u8) -> isize {
    unsafe {
        printf(b"What's your name?\n\0".as_ptr());
        let mut input = [0u8; 100];
        scanf(b"%s\0".as_ptr(), &mut input);
        printf(b"Hello %s!\n\0".as_ptr(), &input);
        0
    }
}

#[lang="eh_personality"] extern fn eh_personality() {}
#[lang="panic_fmt"] fn panic_fmt() -> ! { loop {} }
#[lang="stack_exhausted"] extern fn stack_exhausted() {}

这确实应该在内存使用方面与 C 语言大致相同，但代价是更多的程序员复杂性，以及缺乏通常由 Rust 提供的静态保证（在这里通过使用unsafe来避免）。

为什么 Rust 不像 C 那样有一个稳定的 ABI，为什么我必须用 extern 来注解东西？

对 ABI 的承诺是一个重大的决定，会限制未来潜在的有利的语言变化。鉴于 Rust 在 2015 年 5 月才达到 1.0，现在做出像稳定 ABI 这样大的承诺还为时过早。但这并不意味着未来不会发生。(尽管 C++ 已经成功地运行了很多年而没有指定一个稳定的 ABI)。

extern关键字允许 Rust 使用特定的 ABI，例如定义明确的 C ABI，以便与其他语言互操作。

Rust 代码可以调用 C 代码吗？

可以。从 Rust 中调用 C 代码的设计与从 C++ 中调用 C 代码一样高效。

C 代码可以调用 Rust 代码吗?

是的，Rust 代码必须通过“extern”声明公开，这使得它与 C-ABI 兼容。这样的函数可以作为一个函数指针传递给 C 代码，或者，如果赋予#[no_mangle]属性以禁用符号纠缠，可以直接从 C 代码中调用。

我已经写了完美的 C++ 代码。Rust 能给我什么？

现代 C++ 包含了许多使编写安全和正确的代码不容易出错的特性，但它并不完美，而且仍然很容易引入不安全因素。这是 C++ 的核心开发人员正在努力克服的问题，但是 C++ 受限于悠久的历史，它比他们现在试图实现的很多想法都要早。

Rust 从第一天起就被设计成一种安全的系统编程语言，这意味着它不会受到历史上的设计决定的限制，而这些决定使 C++ 的安全问题变得如此复杂。在 C++ 中，安全是通过谨慎的个人纪律实现的，而且很容易出错。在 Rust 中，安全是默认的。它让你有能力在一个包括不如你完美的人在内的团队中工作，而不必花时间反复检查他们的代码是否存在安全漏洞。

我如何在 Rust 中实现相当于 C++ 模板的专业化？

Rust 目前还没有与模板专业化完全对等的东西，但它正在研究中，希望能很快加入。然而，类似的效果可以通过关联类型实现。

Rust 的所有权系统与 C++ 的移动语义有什么关系？

底层的概念是相似的，但这两个系统在实践中的工作方式是非常不同的。在这两个系统中，“move”一个值都是一种为了转移其底层资源的所有权的方式。例如，移动一个字符串会转移字符串的缓冲区，而不是复制它。

在 Rust 中，所有权转移是默认行为。例如，如果我编写了一个以“String”为参数的函数，这个函数将对其调用者提供的String值拥有所有权。

fn process(s: String) { }

fn caller() {
    let s = String::from("Hello, world!");
    process(s); // Transfers ownership of `s` to `process`
    process(s); // Error! ownership already transferred.
}

正如你在上面的片段中看到的，在函数caller中，对process的第一次调用转移了变量s的所有权。编译器会跟踪所有权，所以第二次调用process会导致一个错误，因为将同一个值的所有权转让两次是非法的。如果一个值有一个未完成的引用，Rust 也会阻止你移动这个值。

C++ 采取了一种不同的方法。在 C++ 中，默认的做法是复制一个值（更确切地说，是调用复制构造函数）。然而，被调用者可以使用一个“rvalue reference”来声明他们的参数，例如string&&，以表明他们将获得该参数所拥有的一些资源的所有权（在这个例子中，字符串的内部缓冲区）。然后调用者必须传递一个临时表达式或使用std::move进行明确的移动。大致相当于上面的函数process的粗略等价物是：

void process(string&& s) { }

void caller() {
    string s("Hello, world!");
    process(std::move(s));
    process(std::move(s));
}

C++ 编译器没有义务去跟踪移动。例如，上面的代码在编译时没有任何警告或错误，至少在使用默认的设置的情况下，上述代码在编译时没有任何警告或错误。此外，在C++中，字符串s本身的所有权（如果不是它的内部缓冲区的话）仍然属于caller，所以s的析构函数会在caller返回时运行，即使它已经被移动了（相反，在 Rust 中，被移动的值只被其新主人丢弃）。

我怎样才能从 Rust 与 C++ 互操作，或者从 C++ 与 Rust 互操作？

Rust 和 C++ 可以通过 C 语言进行互操作。Rust 和 C++ 都为 C 语言提供了一个外来函数接口，并可以用它来进行相互之间的通信。如果编写 C 语言绑定太过繁琐，你可以使用rust-bindgen来帮助自动生成可行的 C 语言绑定。

Rust 有 C++ 风格的构造函数吗？

不，函数的作用与构造函数相同，不会增加语言的复杂性。在 Rust 中，相当于构造函数的通常名称是new()，尽管这只是一个惯例而不是语言规则。new()函数实际上就像其他函数一样。它的一个例子是这样的。

struct Foo {
    a: i32,
    b: f64,
    c: bool,
}

impl Foo {
    fn new() -> Foo {
        Foo {
            a: 0,
            b: 0.0,
            c: false,
        }
    }
}

Rust 有复制构造函数吗？

不完全是。实现了Copy的类型会做一个标准的类似于 C 语言的“浅拷贝”，不需要额外的工作（类似于 C++ 中的 trivially copyable 类型）。不可能实现需要自定义复制行为的Copy类型。相反，在 Rust 中，“复制构造器”是通过实现Clone特性，并明确调用clone方法来创建的。将用户定义的复制操作符显性化，使开发者更容易识别潜在的昂贵操作。

Rust 有移动构造函数吗？

没有。所有类型的值都是通过memcpy移动的。这使得编写通用的不安全代码变得更加简单，因为赋值、传递和返回都是已知的，不会产生像解绑（unwinding）那样的副作用。

Go 和 Rust 有什么相似之处，又有什么不同？

Rust 和 Go 的设计目标有很大不同。以下的差异并不是唯一的差异（这些差异太多，无法一一列举），但却是其中几个比较重要的差异：

Rust 比 Go 层级更低。例如，Rust 不需要垃圾收集器，而 Go 需要。一般来说，Rust 提供的控制水平与 C 或 C++ 相当。
Rust 的重点是确保安全和效率，同时提供高层次的能力，而 Go 的重点是成为一种小而简单的语言，可以快速编译并与各种工具很好地配合。
Rust 对泛型有很强的支持，而 Go （目前）却没有。
Rust 受到函数式编程世界的强烈影响，包括从 Haskell 的 typeclasses 中提取的类型系统。Go 有一个更简单的类型系统，使用接口进行基本的泛型编程。

Rust traits 与 Haskell typeclasses 相比如何？

Rust traits 类似于 Haskell 的 typeclasses，但目前还没有那么强大，因为 Rust 不能表达更高类型的类型。Rust 的关联类型等同于 Haskell 类型族。

Haskell typeclasses 和 Rust traits 之间的一些具体区别包括：

Rust traits 有一个隐含的第一个参数，叫做Self。Rust 中的trait Bar对应于 Haskell 中的class Bar self，而 Rust 中的trait Bar对应于 Haskell 中的class Bar foo self。
Rust 中的“Supertraits”或“superclass constraints”被写成trait Sub: Super，而 Haskell 中的为class Super self => Sub self。
Rust 禁止无主实例，导致 Rust 中的一致性规则与 Haskell 不同。
Rust 的impl解析在决定两个impl是否重叠或在潜在的impl之间进行选择时，会考虑相关的where条款和特质约束条件。Haskell 只考虑instance声明中的约束，不考虑其他地方提供的任何约束。
Rust 的 traits 的一个子集（“对象安全”的 traits）可以通过 trait 对象用于动态调度。同样的功能在 Haskell 中通过 GHC 的“ExistentialQuantification”可用。

Documentation

为什么 Stack Overflow 上有这么多 Rust 的答案是错误的？

Rust 语言已经存在了很多年，在 2015 年 5 月才达到 1.0 版本。在这之前的时间里，语言发生了很大的变化，而 Stack Overflow 的一些答案是在语言的旧版本时给出的。

随着时间的推移，越来越多的答案将提供给当前的版本，从而改善这个问题，因为过时的答案的比例减少了。

我在哪里报告 Rust 文档中的问题？

你可以在 Rust 编译器issue tracker上报告 Rust 文档中的问题。请务必先阅读贡献指南。

我如何查看我的项目所依赖的库的 Rustdoc 文档？

当你使用cargo doc为你自己的项目生成文档时，它也会为活动的依赖版本生成文档。这些文档会被放到你的项目的target/doc目录下。使用cargo doc --open来打开这些文档，或者自己打开target/doc/index.html。

Rust 认为什么是“未定义”以及什么不是“不安全”？

2021-08-11T07:27:38.000Z

大家应该都听说过 Rust 语言是以安全（Safe）作为特性之一的，但是由于一个悲哀的事实——硬件是不安全（Unsafe）的，所以其实所有的“安全”一定是在“不安全”之上的封装，这也导致了完全意义上的“Safe”是很难做到且功能极其受限的。

那让我们来看看，Rust 的 Safe 边界在哪里。

Rust 认为什么不是“不安全”？

什么是安全的 Rust 相信大家都了解，这里不再赘述；实际上，有一些行为虽然我们会认为是预期之外甚至不安全的，但是 Rust 不会：

死锁
内存、资源泄露
未执行析构就退出
由于指针泄漏，暴露了随机的基地址
整型溢出
逻辑错误

前四个都好理解，特别是内存泄漏这个，在 The Book 中就有提到（而且可以看下，标准库的std::mem:leak都不是 unsafe 的）；这里特别要讨论的是，整型溢出和逻辑错误这两个问题。

整型溢出

如果一段代码包含算术溢出，那是程序员的锅。在下面的讨论中，我们需要区分算术溢出和包装算术（wrapping arithmetic）。前者是错误的，而后者是预期之中的。

当程序员启用了debug_assert!断言（例如，debug 模式下的编译），编译器会在运行时插入动态检查，如果发生了溢出会 panic。其他类型的构建（如 release 模式下）可能会导致 panic 或在溢出时啥都不做。

在隐式包装溢出的情况下，实现者必须通过使用二补数的溢出约定来提供定义明确的（即使仍然被认为是错误的）结果。

Rust 标准库为整型提供了一些方法，允许程序员明确地执行包装算术。例如，i32::wrapping_add提供了二补、包装加法。

标准库还提供了一个Wrapping类型，确保T的所有标准算术操作都有包装语义。

关于整数溢出的错误条件、原理和更多细节，可以参考RFC 560。

逻辑错误

安全代码可以有一些额外的逻辑约束，这些约束在编译时和运行时都无法检查。如果一个程序破坏了这样的约束，其行为可能是未指定的，但不会导致未定义行为。这可能包括 panic、不正确的结果、非预期的中止或者死循环。这种行为也可能在不同的运行、构建或构建种类之间有所不同。

例如，实现Hash和Eq要求相等的值一定要有相等的哈希值。另一个例子是像BinaryHeap、BTreeMap、BTreeSet、HashMap和HashSet这样的数据结构，它们针对在它们 Key 中的对象的修改定义了一些约束。违反这样的约束不被认为是不安全的，然而程序的行为是不可预测的，随时有可能挂。

Rust 认为什么是“未定义”

未定义（Undefined Behaviour）是一个很有意思的定义，算是写 C 和 C++ 程序员的老朋友了，甚至很多代码会依赖未定义行为。

如果 Rust 代码有以下列表中的任何行为，那么它就是不正确的，包括 unsafe 中的代码。unsafe 只意味着避免未定义的行为是由程序员负责的；它没有改变任何关于 Rust 程序决不能引起未定义行为的要求。换言之，无论是否使用 unsafe，都不应该有未定义的行为出现。

在编写 unsafe 代码时，程序员有责任确保任何与不安全代码交互的安全代码不能触发这些行为。对于任何安全的调用者来说，满足这一属性的不安全代码被称为健全（sound）的；如果不安全代码可以被安全代码滥用而表现出未定义的行为，那么它就是不健全的。

要注意，下面的列表并不是详尽的。对于不安全代码中允许和不允许的行为，Rust 的语义并没有正式的模型，所以可能有更多的行为被认为是不安全的。下面的列表只是我们确定的未定义行为。在编写不安全代码之前，请阅读死灵书（Rustonomicon）。

数据竞争（Data races）
在一个悬空或不对齐的原始指针上执行解引用表达式（*expr），即使是在地址表达式上下文中（例如addr_of!(&*expr)）。
破坏了指针别名规则。&mut T和&T遵循 LLVM 的作用域noalias模型，除非&T包含一个UnsafeCell。
修改不可变的数据。const 项中的所有数据都是不可变的。此外，所有共享引用的数据或由不可变的绑定所拥有的数据都是不可变的，除非该数据包含在一个UnsafeCell中。
通过编译器的内建指令调用未定义的行为。
执行当前平台不支持的平台特性编译的代码（见target_feature，这通常会导致 SIGILL）。
调用具有错误调用规约（ABI）的函数或 unwind 具有错误 unwind ABI 的函数。
产生一个无效的值，哪怕是在私有字段和局部字段中。一个值被分配到一个地方或从一个地方读出、传递到一个函数 / 原始操作（primitive operation）或从一个函数 / 原始操作返回都会“产生”一个值。以下的值是无效的：
- bool 中除 false（0）或 true（1）以外的值。
- 类型定义中没有包括的枚举中的判别式。
- 一个空的 fn 指针。
- char 中的一个值是代用的（surrogate）或高于char::MAX的。
- ! （所有的值对这个类型来说都是无效的）。
- 一个整数、浮点值，或从未初始化的内存中获得的原始指针，或str中未初始化的内存。
- 一个引用或Box是悬空的、不对齐的，或者指向一个无效的值。
- 泛引用、Box或原始指针中无效的元数据。
  - 如果一个dyn Trait指针 / 引用指向的 vtable 和对应 Trait 的 vtable 不匹配，那么dyn Trait的元数据是无效的。
  - 如果 Slice 的长度不是有效的 usize（比如，从未初始化的内存中读取的 usize），那么 Slice 的元数据是无效的。
- 对于一个具有自定义的无效值的类型来说是无效的值（看着有点绕），比如在标准库中的NonNull和NonZero*。
  注：Rustc 通过不稳定的rustc_layout_scalar_valid_range_*属性实现了这一点。

注意：对于任何具有受限的有效值集的类型，未初始化的内存也是隐式无效的。换句话说，唯一允许读取未初始化内存的情况是在 union 内和padding中（一个类型的字段 / 元素之间的空隙）。

注：未定义行为会影响整个程序。例如，在 C 语言中调用一个表现出 C 语言未定义行为的函数，意味着你的整个程序包含未定义行为，这也会影响 Rust 代码。反之亦然，Rust 中的未定义行为会对其他语言的任何 FFI 调用所执行的代码造成不良影响。

悬垂指针

如果一个引用 / 指针是空的，或者它所指向的所有地址并非合法的地址（比如 malloc 分配出的内存），那么它就是悬垂的。它所指向的范围是由指针值和被指向类型的大小决定的（使用size_of_val）。因此，如果指向的范围是空的，悬垂与非空是一样的。

要注意，切片和字符串指向它们的整个范围，所以它们的长度不可能很大。内存分配的长度、切片和字符串的长度不能大于isize::MAX字节。

【译】Inventing the Service trait

2021-05-24T08:21:59.000Z

写在前面：
最近看到了一篇讲 Rust 如何对框架进行抽象的文章，写得非常好，这两天抽空翻译了一下。
原文：https://tokio.rs/blog/2021-05-14-inventing-the-service-trait

正文

Tower是一个模块化和可重复使用的用来构建 client 和 server 的组件库。其核心是Service特性。一个Service是一个异步函数，它接受一个请求并产生一个响应。然而，Tower设计的某些方面可能不是那么一目了然。

与其解释今天存在于Tower中的Service特性，不如来看看Service背后的设计考量。让我们试试看，如果今天重新设计实现它，我们会怎么做。

想象一下，你正在用 Rust 构建一个简单的 HTTP 框架。这个框架将允许用户提供接收请求并返回响应的处理逻辑来实现一个 HTTP 服务器。你可能会有这么一个 API：

// 创建一个在 3000 端口监听的服务器
let server = Server::new("127.0.0.1:3000").await?

// 以某种方式运行用户的应用程序
server.run(the_users_application).await?

现在问题来了，the_users_application应该是什么？

最简单的一个实现，可能是这样的：

1
2
3

fn handle_request(request: HttpRequest) -> HttpResponse {
    // ...
}

其中HttpRequest和HttpResponse是由我们的框架提供的一些结构。有了这个，我们就可以这样实现Server::run：

impl Server {
    async fn run(self, handler: F) -> Result<(), Error>
    where
        F: Fn(HttpRequest) -> HttpResponse,
    {
        let listener = TcpListener::bind(self.addr).await?

        loop {
            let mut connection = listener.accept().await?
            let request = read_http_request(&mut connection).await?

            // 调用由用户提供的处理程序
            let response = handler(request);

            write_http_response(connection).await?
        }
    }
}

在这里，我们有一个异步函数run，它接受一个闭包，这个闭包接受一个HttpRequest并返回HttpResponse。用户可以像这样使用我们的server：

fn handle_request(request: HttpRequest) -> HttpResponse {
    if request.path() == "/" {
        HttpResponse::ok("Hello, World!" )
    } else {
        HttpResponse::not_found()
    }
}

// 运行服务器并使用我们的 handle_request 函数处理请求
server.run(handle_request).await?

感觉还行，它让用户可以很容易地运行 HTTP 服务器而不必担心任何低层次的细节。

然而，我们目前的设计有一个问题：我们无法处理异步地处理请求。想象一下，我们的用户需要查询一个数据库，或者在处理请求的同时发送一个请求给其他服务器。目前，这样会导致我们需要同步等待 handler 的返回结果，从而导致了阻塞。

如果我们希望我们的服务器能够处理大量的并发连接，我们需要在等待该请求异步完成的同时为其他请求提供服务。我们可以通过让 handler 返回一个future来解决这个问题。

impl Server {
    async fn run(self, handler: F) -> Result<(), Error>
    where
        // handler 现在返回一个通用类型的 Fut
        F: Fn(HttpRequest) -> Fut,
        // FUT 是一个 Future，其输出是一个 HttpResponse
        Fut: Future,
    {
        let listener = TcpListener::bind(self.addr).await?

        loop {
            let mut connection = listener.accept().await?
            let request = read_http_request(&mut connection).await?

            // 等待由 handler 返回的 Future
            let response = handler(request).await?

            write_http_response(connection).await?
        }
    }
}

API 的用法和之前差不多：

// 现在是一个异步函数
async fn handle_request(request: HttpRequest) -> HttpResponse {
    if request.path() == "/" {
        HttpResponse::ok("Hello, World!" )
    } else if request.path() == "/important-data" {
        // 我们现在可以在这里做异步的事情了
        let some_data = fetch_data_from_database().await;
        make_response(some_data)
    } else {
        HttpResponse::not_found()
    }
}

// 运行 server 也是一样的
server.run(handle_request).await?

这就比之前要好很多了，因为我们的 handler 现在可以调用其他异步函数啦。然而，我们仍然缺了点啥——如果我们的处理程序出错了怎么办？我们可以让 Handler 返回一个Result：

impl server {
    async fn run(self, handler: F) -> Result<(), Error>
    where
        F: Fn(HttpRequest) -> Fut,
        // 响应的 Future 允许返回 Error
        Fut: FutureResult>。
    {
        let listener = TcpListener::bind(self.addr).await?

        loop {
            let mut connection = listener.accept().await?
            let request = read_http_request(&mut connection).await?

            // 对响应的 Future 进行模式匹配
            match handler(request).await {
                Ok(response) => write_http_response(connection).await?
                Err(error) => handle_error_somehow(error, connection)。
            }
        }
    }
}

添加更多的功能

现在，假设我们想确保所有的请求都能及时完成或失败，而不是让客户端无限期地等待一个可能永远不会有的响应。

我们可以通过给每个请求添加一个超时来做到这一点。一个超时设置了handler允许持续的最大时间的限制。如果它在这个时间内没有产生响应，就会返回一个错误。这使得客户端可以重试该请求或向用户报告错误，而不是永远等待。

最简单的方法可能是去修改Server，使其可以配置一个超时，然后在每次调用handler时应用该超时。然而，其实你也可以在不修改Server的情况下添加一个超时。使用tokio::time::timeout，我们可以写一个新的处理函数，让它调用我们之前的handle_request，并且设置超时时间为 30 秒：

async fn handler_with_timeout(request: HttpRequest) -> Result {
    let result = tokio::time::timeout(
        Duration::from_secs(30),
        handle_request(request)
    ).await。

    match result {
        Ok(Ok(response)) => Ok(response)。
        Ok(Err(error)) => Err(error),
        Err(_timeout_elapsed) => Err(Error::timeout() )。
    }
}

这提供了一个相当好的抽象，我们能够添加一个超时器而不改变任何现有的代码。

让我们用这种方式再增加一个功能。想象一下，我们正在写一个 JSON API，并且希望在所有的响应上有一个Content-Type: application/json的头。我们可以用类似的方式包装handler_with_timeout：

async fn handler_with_timeout_and_content_type(
    request: HttpRequest,
) -> Result {
    let mut response = handler_with_timeout(request).await?
    response.set_header("Content-Type", "application/json")。
    Ok(response)
}

我们现在有了一个处理程序，它将处理一个 HTTP 请求，超时为 30 秒，并且会设置好正确的Content-Type头，所有这些都不需要修改我们原来的handle_request函数或Server结构。

设计可以以这种方式扩展的库是非常强大的，因为它允许用户通过增加一层新行为来扩展库的功能，而不需要等待库的维护者为其添加支持。

它也使测试变得更容易，因为你可以把你的代码分解成小的隔离的孤立的单元，并为它们编写细粒度的测试，而不必担心其他的部分。

然而，又有了一个问题：我们目前的设计是套娃，也就是实现一个处理函数来实现功能，并在其内部调用其他处理函数。这能 work，但如果我们想增加更多的额外功能，它并不能很好地扩展。

想象一下，我们有许多handle_with_*函数，每一个都增加了一点儿新的行为。要硬编码谁调用谁的这个调用链将成为一种挑战。我们目前的调用链是：

handler_with_timeout_and_content_type，调用
handler_with_timeout，调用
handle_request，实际处理请求。

如果我们能以某种方式组合这三个函数而不需要硬编码确切的顺序，那就更好了，就像这样：

1	let final_handler = with_content_type(with_timeout(handle_request));

同时仍然能够像以前一样运行我们的处理程序。

1	server.run(final_handler).await?

你可以把with_content_type和with_timeout作为函数来实现，该函数接受一个F: Fn(HttpRequest) -> Future的参数并返回一个impl Fn(HttpRequest) -> Future>的闭包。这也不是不行，但所有这些闭包类型会很快变得难以处理。

`Handler`trait

让我们来尝试另一种方法。与其让Server::run接受了一个闭包(Fn(HttpRequest) -> …)，不如让我们定义一个新的 trait 来封装async fn(HttpRequest) -> Result:

1
2
3

trait Handler {
    async fn call(&mut self, request: HttpRequest) -> Result;
}

有了这样一个 trait，我们就可以编写实现它的具体类型，这样我们就不必到处用Fn了。

然而，Rust 目前不支持 async trait 方法，所以我们有两个选择：

让call返回一个 Boxed Future，如Pin>。这也就是async-trait干的事。
在Handler中添加一个关联的type Future，这样用户就可以指定自己的类型。

我们采用方案二，因为它是最灵活的。有一个具体的 Future 类型的用户可以避免Box的开销，而不在乎的用户也可以使用Pin>。

trait handler {
    type Future: FutureResult>;

    fn call(&mut self, request: HttpRequest) -> Self::Future;
}

我们仍然要求Handler::Future实现输出为Result的Future，因为那是Server::run的要求。

让call接受&mut self是有用的，因为它允许处理程序在必要时更新他们的内部状态¹。

让我们把原来的handle_request函数转换为使用这个特性的实现：

struct RequestHandler;

impl Handler for RequestHandler {
    // 为了简单起见，我们在这里使用 Pin>，但也可以定义我们的
    // 自己的 Future 类型，以避免开销。
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: HttpRequest) -> Self::Future {
        Box::pin(async move {
            // 与我们之前的实现相同
            if request.path() == "/" {
                Ok(HttpResponse::ok("Hello, World!"))
            } else if request.path() == "/important-data" {
                let some_data = fetch_data_from_database().await?;
                Ok(make_response(some_data))
            } else {
                Ok(HttpResponse::not_found())
            }
        })
    }
}

那我们如何基于这个实现超时呢？请记住，我们的目标是允许我们在不修改每个单独部分的情况下，将不同的功能组合在一起。

我们可以定义一个通用的Timeout结构，就像这样：

struct Timeout {
    // T 实现了`Handler'的类型
    inner_handler: T,
    duration: Duration,
}

然后我们可以为Timeout实现Handler并委托给T的Handler实现。

impl Handler for Timeout
where
    T: Handler,
{
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: HttpRequest) -> Self::Future {
        Box::pin(async move {
            let result = tokio::time::timeout(
                self.duration,
                self.inner_handler.call(request),
            ).await;

            match result {
                Ok(Ok(response)) => Ok(response),
                Ok(Err(error)) => Err(error),
                Err(_timeout) => Err(Error::timeout()),
            }
        })
    }
}

这里重要的一行是self.inner_handler.call(request)，在这我们继续调用内部处理程序，让它做自己的事情而不管关它是什么。我们只需要知道它完成后会返回一个Result。

但是，这段代码编译不过：

error[E0759]: `self` has an anonymous lifetime `'_` but it needs to satisfy a `'static` lifetime requirement
   --> src/lib.rs:145:29
    |
144 |       fn call(&mut self, request: HttpRequest) -> Self::Future {
    |               --------- this data with an anonymous lifetime `'_`...
145 |           Box::pin(async move {
    |  _____________________________^
146 | |             let result = tokio::time::timeout(
147 | |                 self.duration,
148 | |                 self.inner_handler.call(request),
...   |
155 | |             }
156 | |         })
    | |_________^ ...is captured here, requiring it to live as long as `'static`

编译出错的原因是，我们正在捕获一个&mut self并将其移到一个异步的代码块中。这意味着我们的 Future 和&mut self的生命周期是相同的。但是这并不符合我们的预期，因为我们可能想在多个线程上运行我们的 Future 以获得更好的性能，或者产生多个 Future 并将它们全部并行运行。如果对 handler 的引用存在于 Future² 中，这就不可能了。

因此，我们需要将&mut self转换为一个有所有权的self。这正是Clone所做的。

// 这必须是 Clone，才能使 Timeout 成为 Clone
#[derive(Clone)]
struct RequestHandler;

impl Handler for RequestHandler {
    // ...
}

#[derive(Clone)]
struct Timeout {
    inner_handler: T,
    duration: Duration,
}

impl Handler for Timeout
where
    T: Handler + Clone,
{
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: HttpRequest) -> Self::Future {
        // 获得`&mut self`的所有权
        let mut this = self.clone();

        Box::pin(async move {
            let result = tokio::time::timeout(
                this.duration,
                this.inner_handler.call(request),
            ).await;

            match result {
                Ok(Ok(response)) => Ok(response),
                Ok(Err(error)) => Err(error),
                Err(_timeout) => Err(Error::timeout()),
            }
        })
    }
}

请注意，在这种情况下，clone 是非常便宜的，因为RequestHandler没有任何数据，Timeout只增加了一个Duration（也就是实际上是Copy）。

好，我们现在更进一步了，现在我们得到了另一个错误：

error[E0310]: the parameter type `T` may not live long enough
   --> src/lib.rs:149:9
    |
140 |   impl Handler for Timeout
    |        - help: consider adding an explicit lifetime bound...: `T: 'static`
...
149 | /         Box::pin(async move {
150 | |             let result = tokio::time::timeout(
151 | |                 this.duration,
152 | |                 this.inner_handler.call(request),
...   |
159 | |             }
160 | |         })
    | |__________^ ...so that the type `impl Future` will meet its required lifetime bounds

现在的问题是，因为T可以是任何类型。它甚至可以是一个包含引用的类型，比如Vec<&'a str>。然而这就拉胯了，原因和之前一样。我们需要返回的 Future 有一个'static的生命周期，这样我们可以更容易地传递它。

编译器实际上已经告诉了我们该如何解决——加个T: 'static'：

impl Handler for Timeout
where
    T: Handler + Clone + 'static,
{
    // ...
}

返回的 Future 现在满足了'static'寿命的要求，因为它不包含引用（并且任何T包含的引用都是'static'的）。现在，我们的代码可以编译了！

让我们创建一个类似的 handler 在响应中添加Content-Type头：

#[derive(Clone)]
struct JsonContentType {
    inner_handler: T,
}

impl Handler for JsonContentType
where
    T: Handler + Clone + 'static,
{
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: HttpRequest) -> Self::Future {
        let mut this = self.clone();

        Box::pin(async move {
            let mut response = this.inner_handler.call(request).await?;
            response.set_header("Content-Type", "application/json");
            Ok(response)
        })
    }
}

这与Timeout的模式非常相似。

接下来我们修改Server::run以接受我们新的Handler Trait。

impl Server {
    async fn run(self, mut handler: T) -> Result<(), Error>
    where
        T: Handler,
    {
        let listener = TcpListener::bind(self.addr).await?;

        loop {
            let mut connection = listener.accept().await?;
            let request = read_http_request(&mut connection).await?;

            // have to call `Handler::call` here
            match handler.call(request).await {
                Ok(response) => write_http_response(connection, response).await?,
                Err(error) => handle_error_somehow(error, connection),
            }
        }
    }
}

我们现在可以将我们的三个 handler 组合在一起：

JsonContentType {
    inner_handler: Timeout {
        inner_handler: RequestHandler,
        duration: Duration::from_secs(30),
    },
}

如果我们给我们的类型添加一些new方法，那就更容易构建啦：

let handler = RequestHandler;
let handler = Timeout::new(handler, Duration::from_secs(30));
let handler = JsonContentType::new(handler);

// `handler` has type `JsonContentType>`

server.run(handler).await

搞定！我们现在可以为RequestHandler增加额外的功能而不必修改它的实现。理论上，我们可以把我们的JsonContentType和Timeout handler 放到一个crate中，然后在crates.io上把它作为一个库发布供其他用户使用！

让`Handler`更加灵活

我们的Handler trait看着还不错，但目前它只支持我们的HttpRequest和HttpResponse类型。如果这些变成了泛型，用户就可以使用他们想要的任何类型。

我们将 Request 作为 Trait 的泛型参数，这样服务就可以接受许多不同类型的请求。这样，我们的 handler 就可以用于不同的协议，而不仅仅是 HTTP 了。我们定义 Response 为一个关联类型，因为对于任意给定的请求类型，只能有且只有一种（相关的）响应类型：对应的调用返回的类型。


trait Handler {
    type Response;

    // 错误也应该是一个关联类型。没有理由让它成为一个
    // 硬编码的类型
    type Error;

    // 之前的 Future 类型，但现在它的输出必须使用
    // 相关的 Response 和 Error 类型。
    type Future: FutureResult<Self::Response, Self::Error>>;

    //  call 没有变化，但注意这里的 Request 是个泛型，
    //  而不是我们之前所使用的 HttpRequest 类型。
    fn call(&mut self, request: Request) -> Self::Future;
}

我们对RequestHandler的实现现在变成了：

impl Handler for RequestHandler {
    type Response = HttpResponse;
    type Error = Error;
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: Request) -> Self::Future {
        // 和之前一样
    }
}

Timeout则有点不同，因为它包装了一些其他的Handler，并添加了一个异步超时，它实际上并不关心请求或响应类型是什么，只要它所包装的Handler使用相同的类型。

而Error类型则有点不同。因为tokio::time::timeout会返回Result，我们必须能够把tokio::time::error::Elapsed转换成内部Handler的错误类型。

如果我们把所有这些东西组合在一起，我们就能获得：

// `Timeout`接受任何类型的`R`的请求，只要和`T`接受相同类型的请求
impl Handler for Timeout
where
    // 实际的请求类型必须不包含
    // 引用。编译器会告诉我们要添加
    // 这个，如果我们不这样做的话
    R: 'static,
    // `T`必须接受`R`类型的请求
    T: Handler + Clone + 'static,
    // 我们必须能够将一个超时的请求转换为
    // `T`的错误类型
    T::Error: From,
{
    // 我们的响应类型与`T`相同，因此我们
    // 不需要修改它
    type Response = T::Response;

    // 错误类型也是一样的
    type Error = T::Error;

    // Future 必须输出一个具有正确类型的`Result`。
    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: R) -> Self::Future {
        let mut this = self.clone();

        Box::pin(async move {
            let result = tokio::time::timeout(
                this.duration,
                this.inner_handler.call(request),
            ).await;

            match result {
                Ok(Ok(response)) => Ok(response),
                Ok(Err(error)) => Err(error),
                Err(elapsed) => {
                    // 转换错误类型
                    Err(T::Error::from(elapsed))
                }
            }
        })
    }
}

JsonContentType也有点不同。它不关心请求或错误类型，但它关心响应类型。它必须是Response，这样我们才能调用set_header。

因此，实现如下：

// 还是一个通用的请求类型
impl Handler for JsonContentType
where
    R: 'static,
    // `T`必须接受任何类型的`R`的请求，并返回`HttpResponse`类型的响应。
    T: Handler + Clone + 'static,
{
    type Response = HttpResponse;

    // 我们的错误类型和`T`一致
    type Error = T::Error;

    type Future = Pin<Box<dyn FutureResult>>>;

    fn call(&mut self, request: R) -> Self::Future {
        let mut this = self.clone();

        Box::pin(async move {
            let mut response = this.inner_handler.call(request).await?;
            response.set_header("Content-Type", "application/json");
            Ok(response)
        })
    }
}

最后，传递给Server::run的Handler必须使用HttpRequest和HttpResponse。

impl Server {
    async fn run(self, mut handler: T) -> Result<(), Error>
    where
        T: Handler,
    {
        // ...
    }
}

创建 server 的代码不需要变：

let handler = RequestHandler;
let handler = Timeout::new(handler, Duration::from_secs(30));
let handler = JsonContentType::new(handler);

server.run(handler).await

到目前为止，我们有了一个Handler trait，这可以将我们的应用程序分解成独立的小部分，并可以复用。看着不错！

“如果我告诉你……”

到目前为止，我们只讨论了 server 方面的事情。但是实际上，我们的Handler trait也适用于 HTTP 客户端。比如，我们可以想象有个客户端的Handler接受一些请求并异步地将其发送给互联网上的某 server，我们的Timeout包装器在这里也很有用。JsonContentType可能没啥用，因为设置响应头不是客户端的工作。

由于我们的Handler trait对于定义服务器和客户端都很有用，Handler可能不是一个合适的名字，毕竟客户端并不处理一个请求，它将请求发送给服务器，然后由服务器来处理它。让我们改称我们的 trait 为Service：

trait Service {
    type Response;
    type Error;
    type Future: FutureResult<Self::Response, Self::Error>>;

    fn call(&mut self, request: Request) -> Self::Future;
}

这实际上几乎就是Tower中定义的Service trait了。如果你已经跟着看到了这里，你现在已经了解了Tower的大部分内容了。除了Service trait，Tower还提供了一些实用工具，通过包装其它的Service并实现一个Service，就像我们对Timeout和JsonContentType所做的那样。这些Service的组成方式与我们到目前为止所做的类似。

以下是一些由Tower提供的Service示例：

Timeout——这与我们之前实现的超时基本相同。
Retry——自动重试失败的请求。
RateLimit——限制一个服务在一段时间内收到的请求数量。

像Timeout和JsonContentType这样的类型通常被称为中间件，因为它们包裹着另一个Service并以某种方式对请求或响应进行处理。像RequestHandler这样的类型通常被称为叶子服务，因为它们位于嵌套服务树的叶子上。实际的响应通常是在叶子服务中产生，并由中间件修改。

好了，到这里唯一（唯二？）我们剩下还没聊的是backpressure和poll_ready。

Backpressure

想象一下，现在你想写一个限制请求速率的中间件，来包装一个Service，以对底层服务的最大并发请求数进行限制。如果你的服务对它的负载量有一个硬性的上限，这将是非常有用的。

在我们目前的Service trait中，我们并没有一个好的方法来实现这样的东西，我们可以尝试这样做：

impl Service for ConcurrencyLimit {
    fn call(&mut self, request: R) -> Self::Future {
        // 1. 检查当前正在处理的请求数的计数器。
        // 2. 如果有剩余的容量，将请求发送到`T`，并增加计数器。
        // 3. 如果没有，则等到有能力时再进行处理。
        // 4. 当返回响应后，减去计数器。
    }
}

如果没有剩余的容量，我们必须等待，并在容量可用时以某种方式得到通知。此外，我们必须在等待时将请求保留在内存中（也称为缓冲）。这意味着，等待的请求越多，我们的程序就会使用更多的内存——如果产生的请求超过我们的服务所能处理的数量，我们可能会耗尽内存。
只有当我们确定服务有能力处理请求时，才为请求分配空间，这将是更稳健的做法。否则，在我们等待我们的服务准备好时，我们有可能使用大量的内存来缓冲请求。

如果说Service有这样一个方法，那就完美了：

1
2
3

trait Service {
    async fn ready(&mut self);
}

ready将是一个异步函数，当服务有足够的容量来接收一个新的请求时，它就会完成并返回。我们将要求用户首先调用service.ready().await，然后再进行service.call(require).await。

将“调用服务”与“预留容量”分开，还可以有新的用法：比如我们可以维护一组“准备好的服务”，并在后台保持更新。这样，当一个请求到来时，我们已经有了一个可以使用的服务，而不需要首先等待它准备好。

通过这种设计，ConcurrencyLimit可以在ready内部计算容量，而不允许用户调用call，直到有足够的容量。

不关心容量的服务可以从ready中立即返回，或者如果它们包含了一些内部的Service，它们可以委托给它内部的ready方法。

然而，现在我们仍然不能在 trait 中定义异步函数。因此，我们可以给Service定义另一个关联类型，叫做ReadyFuture，但是必须返回一个Future会给我们带来我们之前遇到的同样的生命周期问题。如果有一些方法可以解决这个问题就好了。

作为替代，我们可以从Future特性中获得一些灵感，定义一个方法叫做poll_ready。

use std::task::{Context, Poll};

trait Service {
    fn poll_ready(&mut self, cx: &mut Context<'_>) -> Poll<()>;
}

如果服务没有容量，poll_ready将返回Poll::Pending；当容量变得可用时，使用Context中的waker通知调用者。这时，可以再次调用poll_ready，如果它返回Poll::Ready(())，那么容量就被保留了，就可以调用call了。

请注意，从技术上来说，没有任何东西可以阻止用户在没有确定服务准备好的情况下调用call，然而，这样做被认为是违反了Service的 API 调用约定。这时候call可以panic如果服务没有准备好。

poll_ready不返回Future也意味着我们能够快速检查一个服务是否准备好了，而不需要被迫等待它准备好。如果我们
调用poll_ready并返回Poll::Pending，我们可以决定去做其他事情而不是等待。举个例子，这允许你写个负载均衡器，通过服务返回Poll::Pending的频率来估计服务的负载，并将请求发送到负载最小的服务。

使用类似于futures::future::poll_fn或者tower::ServiceExt::ready的东西，仍然可以获得一个等待服务容量可用的 Future。

这种服务与它们的调用者沟通其容量的概念被称为“反压传播”。你可以把它看作是服务向后反推他们的调用者，并且如果他们产生的请求太快了时，告诉他们需要放慢速度。其基本思想是，你不应该向一个没有能力处理的服务发送请求。相反，你应该等待（缓冲），放弃请求（减负），或以其他方式处理能力不足的问题。你可以在这里和这里了解更多关于背压的一般概念。

最后，在预留容量时也可能发生一些错误，所以poll_ready也许应该返回Poll。

有了这一改变，我们现在已经有了完整的tower::Service特性。

pub trait Service {
    type Response;
    type Error;
    type Future: FutureResult<Self::Response, Self::Error>>;

    fn poll_ready(
        &mut self,
        cx: &mut Context<'_>,
    ) -> Poll<Result<(), Self::Error>>;

    fn call(&mut self, req: Request) -> Self::Future;
}

许多中间件不添加自己的背压，而只是委托给被封装的服务的poll_ready实现。然而，中间件的背压确实可以实现一些有趣的用例，例如各种速率限制、负载均衡和自动扩容。

由于你永远不知道一个Service可能由哪些中间件组成，所以重要的是不要忘记调用poll_ready。

有了这一切，调用服务的最常用方法是：

use tower::{
    Service,
    // for the `ready` method
    ServiceExt,
};

let response = service
    // wait for the service to have capacity
    .ready().await?
    // send the request
    .call(request).await?;

— David Pedersen (@davidpdrsn)

脚注

1: 关于call是否应该使用Pin<&mut Self> ，已经有了一些讨论。但是到目前为止，我们决定采用一个普通的 &mut self，这意味着 handler（咳，Services）必须是Unpin。在实践中，这很少出现问题。更多细节可以看这里。

2: 说得更准确一点，这要求响应返回的 Future 必须是'static'的，因为写Box实际上会被 desugar 成Box，因此在fn call(&'_ mut self, ...) 中的匿名lifetime并不满足这个要求。在未来，Rust编译器团队计划增加一个名为泛型关联类型（GAT）的功能，这将解决这个问题。泛型关联类型允许我们将响应的 future 定义为type Future<'a>，call定义为fn call<'a>(&'a mut self, ...) -> Self::Future<'a>，但现在响应返回的 Future 必须是'static的。

一次 Golang 的 time.Now 优化之旅

2021-04-29T06:10:44.000Z

缘起

最近想尝试在 Golang 里面实现clock_gettime的CLOCK_REALTIME_COARSE和CLOCK_MONOTONIC_COARSE，正好深入研究了下 time.Now的实现，还机缘巧合下顺便优化了一把time.Now（虽然最终提交的是 Ian 大佬的版本）。

在这里记录下来整个过程，以供查阅。

time.Now 实现原理

首先我们来看看 time.Now的实现原理，从代码（以下代码基于 Go <= 1.16 版本）入手：

// Provided by package runtime.
func now() (sec int64, nsec int32, mono int64)

// Now returns the current local time.
func Now() Time {
sec, nsec, mono := now()
mono -= startNano
sec += unixToInternal - minWall
if uint64(sec)>>33 != 0 {
return Time{uint64(nsec), sec + minWall, Local}
}
return Time{hasMonotonic | uint64(sec)<uint64(nsec), mono, Local}
}

可以看到，time.Now里面实际上是调用了now来获得对应的时间数值，然后进行了一系列的处理。这部分处理就不说了，网上有较多资料，也不是本文重点。我们接着去runtime包里面找找now是怎么实现的：

//go:linkname time_now time.now
func time_now() (sec int64, nsec int32, mono int64) {
sec, nsec = walltime()
return sec, nsec, nanotime()
}

根据关键字搜索，很快能搜到在runtime的timestub.go文件中的以上代码，可以看到实际上调用了两个方法：walltime和nanotime，这两个方法又调用了walltime1和nanotime1，并且是以汇编实现的，让我们继续深入看下这两个方法的汇编实现，因为代码基本相同，这边以walltime1作为例子：

// func walltime1() (sec int64, nsec int32)
// non-zero frame-size means bp is saved and restored
TEXT runtime·walltime1(SB),NOSPLIT,$16-12
// We don't know how much stack space the VDSO code will need,
// so switch to g0.
// In particular, a kernel configured with CONFIG_OPTIMIZE_INLINING=n
// and hardening can use a full page of stack space in gettime_sym
// due to stack probes inserted to avoid stack/heap collisions.
// See issue #20427.

MOVQSP, R12// Save old SP; R12 unchanged by C code.

get_tls(CX)
MOVQg(CX), AX
MOVQg_m(AX), BX // BX unchanged by C code.

// Set vdsoPC and vdsoSP for SIGPROF traceback.
// Save the old values on stack and restore them on exit,
// so this function is reentrant.
MOVQm_vdsoPC(BX), CX
MOVQm_vdsoSP(BX), DX
MOVQCX, 0(SP)
MOVQDX, 8(SP)

LEAQsec+0(FP), DX
MOVQ-8(DX), CX
MOVQCX, m_vdsoPC(BX)
MOVQDX, m_vdsoSP(BX)

CMPQAX, m_curg(BX)// Only switch if on curg.
JNEnoswitch

MOVQm_g0(BX), DX
MOVQ(g_sched+gobuf_sp)(DX), SP// Set SP to g0 stack

noswitch:
SUBQ$16, SP// Space for results
ANDQ$~15, SP// Align for C code

MOVL$0, DI // CLOCK_REALTIME
LEAQ0(SP), SI
MOVQruntime·vdsoClockgettimeSym(SB), AX
CMPQAX, $0
JEQfallback
CALLAX
ret:
MOVQ0(SP), AX// sec
MOVQ8(SP), DX// nsec
MOVQR12, SP// Restore real SP
// Restore vdsoPC, vdsoSP
// We don't worry about being signaled between the two stores.
// If we are not in a signal handler, we'll restore vdsoSP to 0,
// and no one will care about vdsoPC. If we are in a signal handler,
// we cannot receive another signal.
MOVQ8(SP), CX
MOVQCX, m_vdsoSP(BX)
MOVQ0(SP), CX
MOVQCX, m_vdsoPC(BX)
MOVQAX, sec+0(FP)
MOVLDX, nsec+8(FP)
RET
fallback:
MOVQ$SYS_clock_gettime, AX
SYSCALL
JMP ret

这段代码的注释非常的清晰，根据这段代码，可以看到，实际上是使用的vdso call来获取到当前的时间信息。只不过，由于 Go 是自己维护的协程的栈，而这个栈在某些内核上调用vdso会出问题，所以需要先切换到g0（也就是系统线程的栈）上才行。所以这里在开头和结尾有很多额外的操作，需要制造和清理作案现场。

有同学可能对vdso不了解，这里简单介绍下，实际上一开始获取时间信息是需要通过系统调用的，也就是要 syscall 才行，但是众所周知，syscall 的性能较差，同时获取时间戳又是个高频操作，所以大家也想办法优化了几版，最终是现在采用的vdso的方案。vdso全称是virtual dynamic shared object，简单来说就是把这段原本需要系统调用的方法，像动态链接库（so库）一样加载到用户内存空间里面，这样用户的进程就可以像调用一个普通方法一样调用这个方法了，可以避免系统调用的额外开销。具体可以参考一下：https://man7.org/linux/man-pages/man7/vdso.7.html。

看完walltime1之后我们来看下nanotime1，由于开头的切换到g0的代码都是一样的，所以这里只截取后续部分的代码：

noswitch:
SUBQ$16, SP// Space for results
ANDQ$~15, SP// Align for C code

MOVL$1, DI // CLOCK_MONOTONIC
LEAQ0(SP), SI
MOVQruntime·vdsoClockgettimeSym(SB), AX
CMPQAX, $0
JEQfallback
CALLAX
ret:
MOVQ0(SP), AX// sec
MOVQ8(SP), DX// nsec
MOVQR12, SP// Restore real SP
// Restore vdsoPC, vdsoSP
// We don't worry about being signaled between the two stores.
// If we are not in a signal handler, we'll restore vdsoSP to 0,
// and no one will care about vdsoPC. If we are in a signal handler,
// we cannot receive another signal.
MOVQ8(SP), CX
MOVQCX, m_vdsoSP(BX)
MOVQ0(SP), CX
MOVQCX, m_vdsoPC(BX)
// sec is in AX, nsec in DX
// return nsec in AX
IMULQ$1000000000, AX
ADDQDX, AX
MOVQAX, ret+0(FP)
RET

可以看到，唯二修改的就是调用的clockid——CLOCK_MONOTONIC和RET之前的处理逻辑——将返回结果转换成纳秒。

time.Now 优化

说到这里，大家应该就能发现问题所在了——time.Now调用了一次walltime和一次nanotime，这两次调用都有几乎一样的切换到g0栈再恢复的代码，而且这段代码量还比较多。如果我们把这两次调用给合并到一起，就可以节省一次切换栈和准备工作导致的额外开销了！

Go 官方团队的 Ian 大佬和我（几乎）同时提了对应的 pr 来优化这部分的逻辑，最终 Ian 大佬实现的性能更好（-20%，我的版本是 -17%），于是最终采用的是 Ian 大佬的版本：https://go-review.googlesource.com/c/go/+/314277/。

在`runtime`外调用`vdso`？

回到开头，我是想自己实现clock_gettime的CLOCK_REALTIME_COARSE和CLOCK_MONOTONIC_COARSE，这就需要我在runtime包外部实现以上的一系列操作。但是如果要这么干，就需要把所有runtime包里面的结构体定义全部复制一份（这样在汇编代码里面 include 的 go_asm.h才有对应的偏移量），这样可维护性太差了，而且如果某个版本调整了结构体的顺序，行为就不可定义，太危险了，要不就得每个版本单独复制一份出来。

针对这个问题，也和 Go 官方进行了讨论，最终确实没有什么太好的思路，Go 目前不支持在runtime外部安全地调用vdso。

不过不管怎么样，在这个讨论的过程中，促成了time.Now的优化，还是不枉此行。

Golang 泛型初探

2021-03-09T09:24:55.000Z

Golang 的泛型实现已经正式合并到 master 分支上啦，之后也会在 master 分支上进行开发，那么作为期待这个 feature 许久的 gopher，也想第一时间看看到底是如何实现的。

语法

这里不过多讲解泛型的语法，具体可以参考一下 https://github.com/golang/go/issues/43651 这个 issue。

简单来说，在 struct 和 func 的名字后面可以加一个 [] 里面包含泛型的名字和限制条件，比如：

1
2
3

type container[T any] struct{
    elem T
}

any 是个特殊的关键字，表示所有类型都可以。

示例程序

这里我们写一个示例程序来编译成汇编，来看看泛型到底是怎么实现的：

package main

type Stringer interface {
String() string
}

type Stringer2 interface {
Stringer
}

type container[T Stringer] struct {
s T
}

type stringerImpl struct {
s string
}

func (s stringerImpl) String() string {
return s.s
}

func loop[T any](s []T) {
for _, v := range s {
_ = v
}
}

func main() {
loop([]int{1, 2, 3, 4, 5})

c := container[Stringer2]{}
loop([]container[Stringer2]{c})
}

编译成汇编

我们先基于 master 分支来编译一个 go 出来，然后用这个 go 来执行以下命令：

1	$ go build -gcflags="-G=3 -l -S" main.go > main.s 2>&1

接下来去main.s这个文件看看，就会发现有这么一段代码：

"".#loop[int] STEXT nosplit size=18 args=0x18 locals=0x0 funcid=0x0
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:39)TEXT"".#loop[int](SB), NOSPLIT|ABIInternal, $0-24
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:39)FUNCDATA$0, gclocals·1a65e721a2ccc325b382662e7ffee780(SB)
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:39)FUNCDATA$1, gclocals·69c1753bd5f81501d95132d08af04464(SB)
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:33)MOVQ"".s+16(SP), AX
0x0005 00005 (/Users/purewhite/go/src/local/study/main.go:33)XORLCX, CX
0x0007 00007 (/Users/purewhite/go/src/local/study/main.go:33)JMP12
0x0009 00009 (/Users/purewhite/go/src/local/study/main.go:33)INCQCX
0x000c 00012 (/Users/purewhite/go/src/local/study/main.go:33)CMPQAX, CX
0x000f 00015 (/Users/purewhite/go/src/local/study/main.go:33)JGT9
0x0011 00017 (/Users/purewhite/go/src/local/study/main.go:33)RET
0x0000 48 8b 44 24 10 31 c9 eb 03 48 ff c1 48 39 c8 7f  H.D$.1...H..H9..
0x0010 f8 c3                                            ..
"".#loop[container[Stringer2]] STEXT nosplit size=21 args=0x18 locals=0x0 funcid=0x0
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:44)TEXT"".#loop[container[Stringer2]](SB), NOSPLIT|ABIInternal, $0-24
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:44)FUNCDATA$0, gclocals·1a65e721a2ccc325b382662e7ffee780(SB)
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:44)FUNCDATA$1, gclocals·69c1753bd5f81501d95132d08af04464(SB)
0x0000 00000 (/Users/purewhite/go/src/local/study/main.go:33)MOVQ"".s+16(SP), AX
0x0005 00005 (/Users/purewhite/go/src/local/study/main.go:33)TESTQAX, AX
0x0008 00008 (/Users/purewhite/go/src/local/study/main.go:33)JLE20
0x000a 00010 (/Users/purewhite/go/src/local/study/main.go:33)XORLCX, CX
0x000c 00012 (/Users/purewhite/go/src/local/study/main.go:33)INCQCX
0x000f 00015 (/Users/purewhite/go/src/local/study/main.go:33)CMPQAX, CX
0x0012 00018 (/Users/purewhite/go/src/local/study/main.go:33)JGT12
0x0014 00020 (/Users/purewhite/go/src/local/study/main.go:33)RET
0x0000 48 8b 44 24 10 48 85 c0 7e 0a 31 c9 48 ff c1 48  H.D$.H..~.1.H..H
0x0010 39 c8 7f f8 c3                                   9....

再看 main 中调用的地方：

1
2
3

0x008c 00140 (/Users/purewhite/go/src/local/study/main.go:39)CALL"".#loop[int](SB)
...
0x00c0 00192 (/Users/purewhite/go/src/local/study/main.go:44)CALL"".#loop[container[Stringer2]](SB)

基本可以确定，go 的泛型目前的实现方案是在编译时进行代码生成，这个方案虽然会降低编译速度，但是在运行时是没有性能损耗的。

使用 SIMD 优化 Thrift 编码

2021-01-06T07:41:29.000Z

前情提要

可以先看下我之前在 JTalk 上分享的实践：https://www.bilibili.com/video/BV1UZ4y1g7ju

这篇文章是对于其中我最后说的“使用 SIMD 优化”部分的详细说明。

TL；DR

List 场景下提升六倍，List 提升十二倍。

背景

基于 FastRead/Write 接口，由于我们已经拿到了所有的内存，所以我们可以尝试采用 SIMD 来进一步的优化。

思路

最容易想到的优化点也是公司内最常见的用法 list，这个比较容易想到使用 SIMD 进行优化。

在 thrift binary 里面，int 类型在复制到 buffer 之前需要先转成大端，也就是 binary.BigEndian.PutInt 一次，这个操作原本需要比较多语句，通过软件来模拟，但是在 amd64 下有一个 BSWAP 指令可以直接完成，这个优化 Go 编译器已经做了，所以现在的伪代码如下：

var src, dst
for i := 0; i < len; i++ {
    dst[i] = bswap(src[i])
}

可以看出来，这个操作实际上是很有规律的，并且全都是相邻的操作，符合 SIMD 指令的模式。

POC

先使用了 C++ 做了一个 POC（只贴了关键代码，完整代码见 https://gist.github.com/PureWhiteWu/e88f241fc8b62df06ae1eb04923a88ae）：

const long long int MASK = 0x0001020304050607;
const __mmask16 bit16mask[17] = {0x0000, 0x0001, 0x0003, 0x0007, 0x000f, 0x001f, 0x003f, 0x007f, 0x00ff, 0x01ff, 0x03ff, 0x07ff, 0x0fff, 0x1fff, 0x3fff, 0x7fff, 0xffff};

void avx512_little_2_big(const long long int *src, long long int *dst, int n)
{
    int loop_count = n / 8;
    int remainder = n % 8;
    __m512i mask = _mm512_set1_epi64(MASK);
    for (int i = 0; i < loop_count; i++)
    {
        int index = i * 8;
        __m512i input_data = _mm512_loadu_si512(&src[index]);
        __m512i output_data = _mm512_shuffle_epi8(input_data, mask);
        _mm512_storeu_si512(&avx512_data[index], output_data);
    }
    if (remainder != 0)
    {
        int index = loop_count * 8;
        __m512i padding = _mm512_set1_epi64(0);
        __m512i input_data = _mm512_mask_loadu_epi64(padding, bit16mask[remainder], &src[index]);
        __m512i output_data = _mm512_shuffle_epi8(input_data, mask);
        _mm512_mask_storeu_epi64(&avx512_data[index], bit16mask[remainder], output_data);
    }
    return;
}
void avx2_little_2_big(const long long int *src, long long int *dst, int n)
{
    int loop_count = n / 4;
    int remainder = n % 4;
    __m256i mask = _mm256_set1_epi64x(MASK);
    for (int i = 0; i < loop_count; i++)
    {
        int index = i * 4;
        __m256i input_data = _mm256_loadu_si256((__m256i *)&src[index]);
        __m256i output_data = _mm256_shuffle_epi8(input_data, mask);
        _mm256_storeu_si256((__m256i *)&avx2_data[index], output_data);
    }
    if (remainder != 0)
    {
        int index = loop_count * 4;
        for (int i = index; i < index + remainder; i++)
        {
            avx2_data[i] = bswap_64(src[i]);
        }
    }
    return;
}

测试结果

编译命令如下：

1	$ g++ little_2_big_gcc.cpp -o ll2 -mavx512f -mavx512bw -mavx2 -mavx -O3

在 linux 物理机上进行测试，结果如下：

1
2
3

avx512 time: 27009 us
avx2 time: 21920 us
bswap time: 49967 us

可以得出结论：

avx512 的性能很不稳定，有些情况下还不如 avx2；
avx2 相比 bswap 方案基本可以提升一倍以上的性能；
Linus 诚不欺我。

详细解释

bswap 做的事情是将整个字节序进行倒序，以 int32 为例，包含 4 字节，假设原来数据如下：

00000000 00000001 00000010 00000011

那么 bswap 之后，数据为：

00000011 00000010 00000001 00000000

在 avx2 中，也有一个指令 vpshufb 能够达到类似的效果，不过不是纯粹的 bswap，详见：https://software.intel.com/content/www/us/en/develop/documentation/cpp-compiler-developer-guide-and-reference/top/compiler-reference/intrinsics/intrinsics-for-intel-advanced-vector-extensions-2/intrinsics-for-shuffle-operations-1/mm256-shuffle-epi8.html

shuffle 的意思是“洗牌”，作用是可以根据一个传入的 mask 来重排对应 byte 的位置。所以这里最关键的就是代码示例中最上面那行：

1	const long long int MASK = 0x0001020304050607;

为什么用这个 mask 就行了呢？我们得复习一下大小端的知识。

大端字节序是符合人类阅读习惯的顺序，高位在前，还是以刚才的 int32 作为例子，假如大端序表示如下：

00000011（高位在这里） 00000010 00000001 00000000

那么在我们电脑上，小端字节序就是这么存的：

内存地址	0	1	2	3（高位在这里）
值	00000000	00000001	00000010	00000011

这时候对应的 MASK 是 0x00010203，在内存中以小端序表示为：

内存地址	0	1	2	3（高位在这里）
值	3	2	1	0

我们的机器都是小端序的，所以，在做 shuffle 的时候，内存地址 0 对应的是内存地址 3 处的值，内存地址 1 对应的是内存地址 2 处的值，以此类推。

这样，shuffle 计算下来之后，内存中的值就变成了：

内存地址	0	1	2	3
值	00000011	00000010	00000001	00000000

这时候，也就相当于成功完成了一次 bswap 的操作了。

由于 int64 有 8 位，所以 MASK 为 0x00 01 02 03 04 05 06 07 就可以完成一次 int64 的 bswap。

（注：没有 0 键在编写此节时遭到虐待）

Go 中测试结果

最后附上 Go 中的测试结果，我们测试了 List 中有 12345 个元素的 benchmark：

BenchmarkWriteListI64
BenchmarkWriteListI64-16         703928         1753 ns/op
BenchmarkWriteI64
BenchmarkWriteI64-16              98204        11875 ns/op
BenchmarkWriteListI32
BenchmarkWriteListI32-16        1300507          907 ns/op
BenchmarkWriteI32
BenchmarkWriteI32-16              98522        12580 ns/op

可以看出，在 Go 上的性能提升非常巨大，List 场景下提升六倍，List 更是提升了十几倍。

究其原因，应该是 Go 做的优化太少太差，远远比不上 gcc。

掘金JTalk Meetup 11期 - Golang 进阶指南和最佳实践

2020-12-21T05:54:15.000Z

视频

https://www.bilibili.com/video/BV1UZ4y1g7ju

PPT 下载

链接: https://pan.baidu.com/s/1w8TKFZcFbAi-ug26pzkxug 密码: vvbh

解压密码：purewhite.io

使用人工智能优化 Golang 编译器

2020-10-14T08:26:00.000Z

有多少人工就有多少智能。——鲁迅

缘起

众所周知，字节跳动内部主要使用 Thrift，为了更好地掌控生成代码，我们用 Go 自己实现了 Thrift 代码生成工具。

而我们的故(shi)事(gu)，正是由一次重构开始……

在一次平淡无奇的重构发版后，正当我拎着电脑包往外冲心里已经盘算好了回去之后要拿出我熟练度 30W 的至臻 KDA 卡莎大杀四方时，业务方拉住了我，告诉我他们在用了新版的生成代码后，性能下降了10%。

内心 os：What？？？你们是不是有其它逻辑变更？~~我写的代码怎么可能有 bug~~ 逻辑一模一样的生成代码怎么可能会有性能差异？

好吧，为了避免突然哪一天账号已停用，我还是耐心地问了业务方一个问题：

于是在一通如此这般地各种标准对齐、环境对齐等等一通操作（此处省略 2^10^10 字）后，我们终于搞清楚了状况：

重构后的生成代码比重构之前，在该业务方的 idl 上，性能真的要差 10%！

What？？？虽然重构过生成代码，但是新的生成代码无论从语义上还是实现上都是（几乎）和旧的一致的，怎么可能性能会差？？？

好吧，为了发扬我大 IG 不加班的光辉传统，我们决定直接十五投就完事——把生成代码 revert 回旧版的。好了，问题解决。（第二天，HR：小吴啊，财务室工资结一下）。

正文

先附上我们用来讲解生成代码的 IDL：

struct Example {
    1: list<list<i64>> data1,
    2: map<i64, list<byte>> data2,
    3: list<map<i64, byte>> data3,
}

service Serialize {
    Example Method (1: Example req),
}

首先，对比一下新旧生成代码（由于代码较多，就不直接贴在文章中了）。

旧代码：https://gist.github.com/PureWhiteWu/bdd28734ab1f675bb7b73ecf0c57e994

新代码：https://gist.github.com/PureWhiteWu/63ac02ee613695213fe9eac4e22493ba

可以看到，新旧生成代码，在编解码逻辑上是完全等价的！不过旧代码采用了局部变量，新代码是直接用的对应结构体的字段。我们怀疑是不是这里的差异导致的（这可能会导致计算 offset 的开销），于是生成了汇编进行比较（由于汇编较大，不直接贴了，有兴趣的同学建议自行生成一下看一下），发现确实是多了一条 MOVQ 语句用来计算偏移量！

1	MOVQ"".p+144(SP), AX

看来罪魁祸首好像找到了？不过又感觉哪儿不太对，毕竟现代 CPU 都是有多级流水线的，就多这么一条 MOVQ 语句，对于多级流水线架构的 CPU 来说，性能差距再怎么不可能导致 10% 这么大，特别是尽管这个语句是在 for 循环中的，但是在总的执行的指令占比中也没有 10% 这么多。

为了验证我们的疑问，我们改了一版生成代码，改为了和原先生成的一样使用临时变量，发现确实去掉了这条语句后，性能没有任何变化。也就是说，性能的问题并不是这个间接寻址导致的。

随后，根据生成代码的汇编差异，我们提出了许多猜想，花了大量时间进行验证，但是均不是性能变差的原因（此处过于心酸略过不表）。

最终，我们定位到了是由于在新的生成代码中，相比旧版本的生成代码，在返回错误的时候会额外包装一下：

1
2
3

if err := ...; err != nil {
    return thrift.PrependError(fmt.Sprintf("%T read field x 'xxx' error: ", p), err)
}

而旧版本的生成代码是直接返回的错误：

1
2
3

if err := ...; err != nil {
    return err
}

虽然这些只是在发生错误的时候才会调用到，在正常流程中不会用到，但是生成的汇编代码中这段逻辑占了相当大的比例：

而 Go 的编译器并没有帮我们重排这些指令，导致在真正运行的时候，L1 cache miss 大大提高，极大地降低了性能，参考如下实验结果：

针对这种编译器太弱智导致的问题，只能上人工智能来解决了——有多少人工就有多少智能。

既然编译器不会自动做指令重排，那就我们来帮编译器干这事，改造完成后的生成代码见：https://gist.github.com/PureWhiteWu/296f2bdac6051e4052a68c2bb1de1c07

比较关键的方法是，我们在所有原先return thrift.PrependError的地方，都改为了goto XXXError，如下：

func (p *Example) Read(iprot thrift.TProtocol) error {
var err error
var fieldTypeId thrift.TType
var fieldId int16

if _, err = iprot.ReadStructBegin(); err != nil {
goto ReadStructBeginError
}

for {
_, fieldTypeId, fieldId, err = iprot.ReadFieldBegin()
if err != nil {
goto ReadFieldBeginError
}
if fieldTypeId == thrift.STOP {
break
}
switch fieldId {
case 1:
if fieldTypeId == thrift.LIST {
if err := p.ReadField1(iprot); err != nil {
goto ReadFieldError
}
} else {
if err := iprot.Skip(fieldTypeId); err != nil {
goto SkipFieldError
}
}
case 2:
if fieldTypeId == thrift.MAP {
if err := p.ReadField2(iprot); err != nil {
goto ReadFieldError
}
} else {
if err := iprot.Skip(fieldTypeId); err != nil {
goto SkipFieldError
}
}
case 3:
if fieldTypeId == thrift.LIST {
if err := p.ReadField3(iprot); err != nil {
goto ReadFieldError
}
} else {
if err := iprot.Skip(fieldTypeId); err != nil {
goto SkipFieldError
}
}
default:
if err := iprot.Skip(fieldTypeId); err != nil {
goto SkipFieldError
}
}

if err := iprot.ReadFieldEnd(); err != nil {
goto ReadFieldEndError
}
}
if err := iprot.ReadStructEnd(); err != nil {
goto ReadStructEndError
}

return nil
ReadStructBeginError:
return thrift.PrependError(fmt.Sprintf("%T read struct begin error: ", p), err)
ReadFieldBeginError:
return thrift.PrependError(fmt.Sprintf("%T read field %d begin error: ", p, fieldId), err)
ReadFieldError:
return thrift.PrependError(fmt.Sprintf("%T read field %d '%s' error: ", p, fieldId, fieldIDToName_Example[fieldId]), err)
SkipFieldError:
return thrift.PrependError(fmt.Sprintf("%T field %d skip type %d error: ", p, fieldId, fieldTypeId), err)
ReadFieldEndError:
return thrift.PrependError(fmt.Sprintf("%T read field end error", p), err)
ReadStructEndError:
return thrift.PrependError(fmt.Sprintf("%T read struct end error: ", p), err)
}

通过这种方式，使得我们正常流程中，如果判断 err 出错的情况之下，不再有之前的一大段处理的指令，而仅仅是变成了一条简单的 jmp 指令；而对应的错误处理逻辑，则尽可能放在正常流程 return 之后，使得尽可能减少 cpu load 指令的次数并降低 L1 icache miss；同时，使得所有的错误处理的逻辑在最终的汇编中只会出现一次，而不是出现多次。

这里必须吐槽一波，Go 编译器有时候会“贴心”地帮你把这些代码挪回到上面，但是由于只会出现一次而其它错误处理的地方都会直接 jmp，所以问题也不大，后续可以考虑试一下把这些逻辑扔到一个独立的函数中并标记 noinline 是否可以再度提高性能（使得在主流程中完全不出现）。

经过这个调整，perf 的性能明显好了很多，并且可能比旧版本更优：

The End

至此，这个问题算是搞明白了，在这个过程中，最大的收获是：~~Go 编译器竟然如此的弱智~~ 人工指令重排竟然能带来如此之大的提升。

谨以此文分享我们的经验，希望能够抛砖引玉，为性能优化提出一个新的思路，毕竟鲁迅曾说过：

踩了 Golang sync.Map 的一个坑

2020-08-24T08:23:44.000Z

缘起

最近 Go 1.15 发布了，我也第一时间更新了这个版本，毕竟对 Go 的稳定性还是有一些信心的，于是直接在公司上了生产。

结果，上线几分钟，就出现了 OOM，于是 pprof 了一下 heap，然后赶紧回滚，发现某块本应该在一次请求结束时被释放的内存，被保留了下来而且一直在增长，如图（图中的 linkBufferNode）：

这次上线的变更只有 Go 版本的升级，没有任何其它变动，于是在本地开始测试，发现在本地也能百分百复现。

排查过程

看了 Go 1.15 的 Release Note，发现有俩高度疑似的东西：

去除了一些 GC Data，使得 binary size 减少了 5%；
新的内存分配算法。

于是改 runtime，关闭新的内存分配算法，切换回旧的，等等一顿操作猛如虎下来，发现问题还是没解决，现象仍然存在。

于是实在不行，祭出了GODEBUG="allocfreetrace=1大法，肉眼从100MB+的日志文件里面看啊看啊看啊看啊看啊看啊看啊看啊看啊看啊……（此处省略心酸过程）

最终直觉告诉我，这个问题可能和 Go 1.15 中 sync.Map 的改动有关（别问我为啥，真的是直觉，我也说不出来）。

示例代码

为了方便讲解，我写了一个最小可复现的代码，如下：

package main

import (
"sync"
)

var sm sync.Map

func insertKeys() {
keys := make([]interface{}, 0, 10)
// Store some keys
for i := 0; i < 10; i++ {
v := make([]int, 1000)
keys = append(keys, &v)
sm.Store(keys[i], struct{}{})
}
// delete some keys, but not all keys
for i, k := range keys {
if i%2 == 0 {
continue
}
sm.Delete(k)
}
}

func shutdown() {
sm.Range(func(key, value interface{}) bool {
// do something to key
return true
})
}

func main() {
insertKeys()
// do something ...
shutdown()
}

Go 1.15 中 sync.Map 改动

在 Go 1.15 中，sync.Map 增加了一个方法LoadAndDelete，具体的 issue 在这：sync: add new Map method LoadAndDelete，CL 在这：CL。

为什么我确认是这个改动导致的呢？很简单：我在本地把这个改动 revert 掉了，问题就没了，好了关机下班……

当然没这么简单，知其然要知其所以然，于是开始看到底改了哪块……（此处省略100000字）

最终发现，关键代码是这段：

// LoadAndDelete deletes the value for a key, returning the previous value if any.
// The loaded result reports whether the key was present.
func (m *Map) LoadAndDelete(key interface{}) (value interface{}, loaded bool) {
read, _ := m.read.Load().(readOnly)
e, ok := read.m[key]
if !ok && read.amended {
m.mu.Lock()
read, _ = m.read.Load().(readOnly)
e, ok = read.m[key]
if !ok && read.amended {
e, ok = m.dirty[key]
// Regardless of whether the entry was present, record a miss: this key
// will take the slow path until the dirty map is promoted to the read
// map.
m.missLocked()
}
m.mu.Unlock()
}
if ok {
return e.delete()
}
return nil, false
}

// Delete deletes the value for a key.
func (m *Map) Delete(key interface{}) {
m.LoadAndDelete(key)
}

func (e *entry) delete() (value interface{}, ok bool) {
for {
p := atomic.LoadPointer(&e.p)
if p == nil || p == expunged {
return nil, false
}
if atomic.CompareAndSwapPointer(&e.p, p, nil) {
return *(*interface{})(p), true
}
}
}

在这段代码中，会发现在 Delete 的时候，并没有真正删除掉 key，而是从 key 中取出了 entry，然后把 entry 设为 nil……

所以，在我们场景中，我们把一个连接作为 key 放了进去，于是和这个连接相关的比如 buffer 的内存就永远无法释放了……

那么为什么在 Go 1.14 中没有问题呢？以下是 Go 1.14 的代码：

// Delete deletes the value for a key.
func (m *Map) Delete(key interface{}) {
read, _ := m.read.Load().(readOnly)
e, ok := read.m[key]
if !ok && read.amended {
m.mu.Lock()
read, _ = m.read.Load().(readOnly)
e, ok = read.m[key]
if !ok && read.amended {
delete(m.dirty, key)
}
m.mu.Unlock()
}
if ok {
e.delete()
}
}

在 Go 1.14 中，如果 key 在 dirty 中，是会被删除的；而凑巧，我们其实“误用”了 sync.Map，在我们的使用过程中没有读操作，导致所有的 key 其实都在 dirty 里面，所以当调用 Delete 的时候是会被真正删除的。

要注意，无论哪个版本的 Go，一旦 key 升级到了 read 中，在没有 miss 到一定的值让 dirty 提升为 read 时，key 都是永远不会被删除的。也就是说，极端情况之下，key 是会泄露的。

总结

在 Go <= 1.15 版本中，sync.Map 中的 key 在极端情况下是不会被删除的，如果在 Key 中放了一个大的对象，或者关联有内存，就会导致内存泄漏。

针对这个问题，我已经向 Go 官方提出了Issue，目前来看这个 behaviour 定义为了 bug（因为违背了 Go 1 兼容性承诺，和 1.14 中的 behaviour 不同了），已经由 @ChangKun Ou 大佬提了 pr 修复了，并且 backport 到了 1.15.1 中。

而针对 read 中的 key 在没有 dirty 被提升时不会删除的问题，目前看来是一个设计上的 trade-off，如果有真实世界中的程序（real-world program）出问题的话，再提 issue，看看是否要解决。

为什么 Golang 函数赋值会产生内存分配？

2020-06-30T03:05:51.000Z

缘起

这几天在重构某段代码后，做了一次性能测试，火焰图中发现了一个十分奇怪的runtime.newobject的调用，大致占用2%，而找遍了整段代码都没有发现有新建对象相关的逻辑。于是迫不得已，祭出了汇编大法，终于定位到了问题所在。这篇文章会使用一段最小可复现的代码来分享这个问题以及背后的原因。

Show me the code

package main

import (
_ "unsafe"
)

type MyFunc func()

type myFuncImplStruct struct {
}

//go:noinline
func (m *myFuncImplStruct) myFunc() {
return
}

//go:noinline
func (m myFuncImplStruct) myFunc2() {
return
}

//go:noinline
func myFunc() {
return
}

type myFuncContainer struct {
f MyFunc
}

//go:noinline
func newFuncContainer(f MyFunc) *myFuncContainer {
n := &myFuncContainer{}
n.f = f
return n
}

func main() {
m := &myFuncImplStruct{}
m2 := myFuncImplStruct{}
c1 := newFuncContainer(myFunc)
c2 := newFuncContainer(m.myFunc)
c3 := newFuncContainer(m2.myFunc2)

_, _, _ = c1, c2, c3
}

这段代码中，初看起来貌似在 main 函数中（不考虑 newFuncContainer 函数中导致的内存分配）没有运行时内存分配（m 会被优化成全局区，所以不会真的导致运行时内存分配），但是实际上在 main 中是有两次运行时内存分配的，这是怎么回事呢？

函数还能逃逸到堆上？

我们用-gcflags="-m"来打印一下编译器的优化信息，可以看到：

./main.go:13:7: m does not escape
./main.go:32:23: leaking param: f
./main.go:33:7: &myFuncContainer literal escapes to heap
./main.go:39:7: &myFuncImplStruct literal escapes to heap
./main.go:42:26: m.myFunc escapes to heap
./main.go:43:27: m2.myFunc2 escapes to heap
:1: .this does not escape

竟然说 42、43 两行中的m.myFunc和m2.myFunc2“逃逸到了堆上”？一个函数还能逃逸到堆上？？？

实锤了

虽然看起来貌似真的是这里导致的，但是我们说话做事要有证据，于是祭出汇编大法（-gcflags="-S"），看一下生成的汇编代码是啥样的：

"".main STEXT size=160 args=0x0 locals=0x18
……
0x0031 00049 (main.go:42)PCDATA$0, $1
0x0031 00049 (main.go:42)LEAQtype.noalg.struct { F uintptr; R *"".myFuncImplStruct }(SB), AX
0x0038 00056 (main.go:42)PCDATA$0, $0
0x0038 00056 (main.go:42)MOVQAX, (SP)
0x003c 00060 (main.go:42)CALLruntime.newobject(SB)
0x0041 00065 (main.go:42)PCDATA$0, $1
0x0041 00065 (main.go:42)MOVQ8(SP), AX
0x0046 00070 (main.go:42)LEAQ"".(*myFuncImplStruct).myFunc-fm(SB), CX
0x004d 00077 (main.go:42)MOVQCX, (AX)
0x0050 00080 (main.go:42)PCDATA$0, $2
0x0050 00080 (main.go:42)LEAQruntime.zerobase(SB), CX
0x0057 00087 (main.go:42)PCDATA$0, $1
0x0057 00087 (main.go:42)MOVQCX, 8(AX)
0x005b 00091 (main.go:42)PCDATA$0, $0
0x005b 00091 (main.go:42)MOVQAX, (SP)
0x005f 00095 (main.go:42)CALL"".newFuncContainer(SB)
0x0064 00100 (main.go:43)PCDATA$0, $1
0x0064 00100 (main.go:43)LEAQtype.noalg.struct { F uintptr; R "".myFuncImplStruct }(SB), AX
0x006b 00107 (main.go:43)PCDATA$0, $0
0x006b 00107 (main.go:43)MOVQAX, (SP)
0x006f 00111 (main.go:43)CALLruntime.newobject(SB)
0x0074 00116 (main.go:43)PCDATA$0, $1
0x0074 00116 (main.go:43)MOVQ8(SP), AX
0x0079 00121 (main.go:43)LEAQ"".myFuncImplStruct.myFunc2-fm(SB), CX
0x0080 00128 (main.go:43)MOVQCX, (AX)
0x0083 00131 (main.go:43)PCDATA$0, $0
0x0083 00131 (main.go:43)MOVQAX, (SP)
0x0087 00135 (main.go:43)CALL"".newFuncContainer(SB)
……

这下子实锤了，真的是这里导致的，但是为啥呢？我把一个函数赋值给某个变量，为什么会导致一次内存分配呢？函数名不是一个指针，指向函数所在的代码地址么？

Golang 函数调用机制

在 Golang 中，函数调用其实并不像 C 那么简单，有一定的分类：

函数调用分类

在 Go 中，一共有 4 种类型的函数：

顶层函数（普通的函数）
有值接收者的函数
有指针接收者的函数
函数字面量

有 5 种类型的函数调用：

直接调用顶层函数
直接调用有值接收者的函数
直接调用有指针接收者的函数
间接调用函数值（func value）
间接调用 interface 中函数

以下的示例程序展示了所有可能的函数调用方式：

package main

func TopLevel(x int) {}

type Pointer struct{}

func (*Pointer) M(int) {}

type Value struct{}

func (Value) M(int) {}

type Interface interface{ M(int) }

var literal = func(x int) {}

func main() {
// direct call of top-level func
TopLevel(1)

// direct call of method with value receiver (two spellings, but same)
var v Value
v.M(1)
Value.M(v, 1)

// direct call of method with pointer receiver (two spellings, but same)
var p Pointer
(&p).M(1)
(*Pointer).M(&p, 1)

// indirect call of func value (×4)
f1 := TopLevel
f1(1)
f2 := Value.M
f2(v, 1)
f3 := (*Pointer).M
f3(&p, 1)
f4 := literal
f4(1)

// indirect call of method on interface (×3)
var i Interface
i = v
i.M(1)
i = &v
i.M(1)
i = &p
i.M(1)
Interface.M(i, 1)
Interface.M(v, 1)
Interface.M(&p, 1)
}

如上程序所示，一共有 10 种可能的调用组合：

直接调用顶层函数 /
直接调用值接收者函数 /
直接调用指针接收者函数 /
间接调用函数值（func value） / 函数值为顶层函数
间接调用函数值 / 函数值为值接收者函数
间接调用函数值 / 函数值为指针接收者函数
间接调用函数值 / 函数值函数字面量
间接调用 interface 中函数 / interface 为值，调用值接收者函数
间接调用 interface 中函数 / interface 为指针，调用值接收者函数
间接调用 interface 中函数 / interface 为指针，调用指针接收者函数

以上列表中，斜杠 / 左侧是在编译时就已知的信息，右侧是在运行时才知道的信息。在编译时生成的代码是不知道运行时的信息的，所以在运行时需要生成一些额外的适配器函数（adapter functions）来达成间接调用。

函数间接调用实现

看到这里，大家应该能隐约猜测到原因了，正如你所猜测，在我们开头的程序中，存在着间接调用，Go 分配的这个对象和间接调用脱不了关系。由于直接调用没啥可说的，所以我们略过不谈，只说间接调用。

在 Go 里面，间接调用的实现如下图：

实际上，Go 分配了一个额外的对象，其第一个字段是一个指向我们真实函数的指针，第二个对象是与函数强相关的一些数据（对，没错，说的就是接收者 receiver）。于是，一次函数调用实际上会生成类似如下的代码：

1
2
3

MOV …, R0
MOV 0(R0), R1
CALL R1  # called code can access “data” using R0

有一个例外，就是当一个函数并没有相关数据，如仅仅会捕获外部的局部变量的函数字面量，那么这个函数就不会有相关联的数据，于是内存布局如下：

在这个场景下，Go 会将这个变量的分配优化在只读区，不会在每次调用时都进行分配，也就是生成如下代码：

MOV $MyFunc·f(SB), f1

DATA MyFunc·f(SB)/8, $MyFunc(SB)
GLOBL MyFunc·f(SB), 10, $8

所以我们其实不必太过担心这种场景下的性能损耗，在这种场景下是 0 损耗的。

对于非例外的场景，一个适配器函数生成的代码类似下面这样：

type funcValue struct {
f uintptr // 指向函数的指针
r associatedType
}

// 这里为实际函数签名
func funcAdapter(...) (...) {
r := (associatedType)(R0 + 8)
return r.f(...)
}

f := &funcValue{funcAdapter, r}

在调用时，调用的实际上是适配器函数，适配器函数随后去调用真实的函数。

为啥要这么干呢？

其实想想也很简单，对于值接收者和指针接收者函数，调用时第一个参数为 self，那么如果我现在是需要把某个关联在特定值 / 指针上的函数作为一个函数值赋值给某个函数变量时，我也需要一起把对应的值 / 指针信息一起带上，不然等我真正调用的时候，我怎么知道应该调用的是哪个值 / 指针上的方法呢？也就是说，传入函数的 self 值应该是多少呢？

说了那么多，到底为啥呢？

回到我们开头的问题，可以看到造成两次内存分配的罪魁祸首已然找到，在汇编代码里面其实也已经能看出端倪：

 0x0031 00049 (main.go:42)PCDATA$0, $1
0x0031 00049 (main.go:42)LEAQtype.noalg.struct { F uintptr; R *"".myFuncImplStruct }(SB), AX
0x0038 00056 (main.go:42)PCDATA$0, $0
0x0038 00056 (main.go:42)MOVQAX, (SP)
0x003c 00060 (main.go:42)CALLruntime.newobject(SB)
0x0041 00065 (main.go:42)PCDATA$0, $1
0x0041 00065 (main.go:42)MOVQ8(SP), AX
0x0046 00070 (main.go:42)LEAQ"".(*myFuncImplStruct).myFunc-fm(SB), CX
0x004d 00077 (main.go:42)MOVQCX, (AX)
0x0050 00080 (main.go:42)PCDATA$0, $2
0x0050 00080 (main.go:42)LEAQruntime.zerobase(SB), CX
0x0057 00087 (main.go:42)PCDATA$0, $1
0x0057 00087 (main.go:42)MOVQCX, 8(AX)
0x005b 00091 (main.go:42)PCDATA$0, $0
0x005b 00091 (main.go:42)MOVQAX, (SP)
0x005f 00095 (main.go:42)CALL"".newFuncContainer(SB)
0x0064 00100 (main.go:43)PCDATA$0, $1
0x0064 00100 (main.go:43)LEAQtype.noalg.struct { F uintptr; R "".myFuncImplStruct }(SB), AX
0x006b 00107 (main.go:43)PCDATA$0, $0
0x006b 00107 (main.go:43)MOVQAX, (SP)
0x006f 00111 (main.go:43)CALLruntime.newobject(SB)
0x0074 00116 (main.go:43)PCDATA$0, $1
0x0074 00116 (main.go:43)MOVQ8(SP), AX
0x0079 00121 (main.go:43)LEAQ"".myFuncImplStruct.myFunc2-fm(SB), CX
0x0080 00128 (main.go:43)MOVQCX, (AX)
0x0083 00131 (main.go:43)PCDATA$0, $0
0x0083 00131 (main.go:43)MOVQAX, (SP)
0x0087 00135 (main.go:43)CALL"".newFuncContainer(SB)

注意上述 LEAQtype.noalg.struct { F uintptr; R *"".myFuncImplStruct }(SB), AX这段代码，咱也别管啥意思，反正看到了一个和之前说的适配器很像的一个 struct，这个 struct 有两个字段，第一个是F uintptr，第二个是R *myFuncImplStruct；下面还有一个LEAQtype.noalg.struct { F uintptr; R "".myFuncImplStruct }(SB), AX，只不过这里的 R 是myFuncImplStruct的值而不是指针，这正好和我们代码吻合。

总结

好了，到这基本上这个问题清楚了，要优化的话也很简单，只要把实际上并不需要有值接收者或者指针接收者的函数改为顶层函数即可，或者尽可能不要将一个值接收者 / 指针接收者函数进行间接调用。

由此可以看出，有接收者的函数是有代价的，不能乱用啊，代码设计还是要合理，否则是会引入额外的性能开销的。

参考资料

https://docs.google.com/document/d/1bMwCey-gmqZVTpRax-ESeVuZGmjwbocYs1iHplK-cjo/pub

golang 在 runtime 中的一些骚东西

2019-11-28T14:00:43.000Z

最近在研究性能优化的时候，看到了 golang runtime 包下的一个文档HACKING.md觉得颇有意思，读完之后觉得对于 runtime 的理解更上一层，于是想着翻译一下。

本章内容会有一定深度，需要有一定基础的读者，限于篇幅在这里不可能完全展开各个细节。

这一篇文档面向的读者是 runtime 的开发者，所以有很多内容在我们普通使用中是接触不到的。

这篇文档是会被经常编辑的，并且随着时间推移目前的内容可能会过时。这篇文档旨在说明写 runtime 代码和普通的 go 代码有什么不同，所以关注于一些普遍的概念而不是一些细节的实现。

调度器结构

调度器管理三个在 runtime 中十分重要的类型：G、M和P。哪怕你不写 scheduler 相关代码，你也应当要了解这些概念。

G、M 和 P

一个G就是一个 goroutine，在 runtime 中通过类型g来表示。当一个 goroutine 退出时，g对象会被放到一个空闲的g对象池中以用于后续的 goroutine 的使用（译者注：减少内存分配开销）。

一个M就是一个系统的线程，系统线程可以执行用户的 go 代码、runtime 代码、系统调用或者空闲等待。在 runtime 中通过类型m来表示。在同一时间，可能有任意数量的M，因为任意数量的M可能会阻塞在系统调用中。（译者注：当一个M执行阻塞的系统调用时，会将M和P解绑，并创建出一个新的M来执行P上的其它G。）

最后，一个P代表了执行用户 go 代码所需要的资源，比如调度器状态、内存分配器状态等。在 runtime 中通过类型p来表示。P的数量精确地（exactly）等于GOMAXPROCS。一个P可以被理解为是操作系统调度器中的 CPU，p类型可以被理解为是每个 CPU 的状态。在这里可以放一些需要高效共享但并不是针对每个P（Per P）或者每个M（Per M）的状态（译者注：意思是，可以放一些以P级别共享的数据）。

调度器的工作是将一个G（需要执行的代码）、一个M（代码执行的地方）和一个P（代码执行所需要的权限和资源）结合起来。当一个M停止执行用户代码的时候（比如进入阻塞的系统调用的时候），就需要把它的P归还到空闲的P池中；为了继续执行用户的 go 代码（比如从阻塞的系统调用退出的时候），就需要从空闲的P池中获取一个P。

所有的g、m和p对象都是分配在堆上且永不释放的，所以它们的内存使用是很稳定的。得益于此，runtime 可以在调度器实现中避免写屏障（译者注：垃圾回收时需要的一种屏障，会带来一些性能开销）。

`getg()`和`getg().m.curg`

如果想要获取当前用户的g，需要使用getg().m.curg。

getg()虽然会返回当前的g，但是当正在系统栈或者signal栈上执行的时候，会返回的是当前M的g0或者gsignal，而这很可能不是你想要的。

如果要判断当前正在系统栈上执行还是用户栈上执行，可以使用getg() == getg().m.curg。

栈

每个存活着的（non-dead）G都会有一个相关联的用户栈，用户的代码就是在这个用户栈上执行的。用户栈一开始很小（比如 2K），并且动态地生长或者收缩。

每一个M都有一个相关联的系统栈（也被称为g0栈，因为这个栈也是通过g实现的）；如果是在 Unix 平台上，还会有一个 signal栈（也被称为gsignal栈）。系统栈和signal栈不能生长，但是足够大到运行任何 runtime 和 cgo 的代码（在纯 go 二进制中为 8K，在 cgo 情况下由系统分配）。

runtime 代码经常通过调用systemstack、mcall或者asmcgocall临时性的切换到系统栈去执行一些特殊的任务，比如：不能被抢占的、不应该扩张用户栈的和会切换用户 goroutine 的。在系统栈上运行的代码隐含了不可抢占的含义，同时垃圾回收器不会扫描系统栈。当一个M在系统栈上运行时，当前的用户栈是没有被运行的。

nosplit 函数

大多数函数都以检查堆栈指针和当前 G 的堆栈边界的 prologue 开始，并在堆栈需要增长时调用 morestack。

可以使用//go:nosplit（或者在汇编中使用NOSPLIT）标记功能，以指示它们不应该具有此 prologue。这有几个用途：

必须在用户堆栈上运行的功能，但不能调用堆栈增长。例如因为这会导致死锁，或者因为它们在堆栈上有无类型的 words。
在进入时不可被抢占的功能。
可能没有有效 G 的功能。例如，runtime 初始化代码中的功能，或者可能从 C 代码进入的功能，例如 cgo 回调或信号处理程序。

可拆分函数确保堆栈上有一定数量的空间，以便在其中运行不可拆分函数，链接器检查任何静态链的不可拆分函数调用是否不超过此限制。

任何具有//go:nosplit注释的函数都应在其文档注释中解释为什么是不可拆分的。

错误处理和上报

在用户代码中，有一些可以被合理地（reasonably）恢复的错误可以像往常一样使用panic，但是有一些情况下，panic可能导致立即的致命的错误，比如在系统栈中调用或者当执行mallocgc时。

大部分的 runtime 的错误是不可恢复的，对于这些不可恢复的错误应该使用throw，throw会打印出traceback并立即终止进程。throw应当被传入一个字符串常量以避免在该情况下还需要为 string 分配内存。根据约定，更多的信息应当在throw之前使用print或者println打印出来，并且应当以runtime.开头。

对于不可恢复的错误，如果用户代码有可能导致故障（例如并发 map 写入），请使用 fatal。

为了进行 runtime 的错误调试，可以使用GOTRACEBACK=system或GOTRACEBACK=crash运行。panic和fatal的输出由GOTRACEBACK描述。throw的输出始终包括 runtime stack、元数据和所有 goroutines，无论GOTRACEBACK是什么（即与GOTRACEBACK=system等效）。是否让throw崩溃仍然受GOTRACEBACK控制。

同步

runtime 中有多种同步机制，这些同步机制不仅是语义上不同，和 go 调度器以及操作系统调度器之间的交互也是不一样的。

最简单的就是mutex，可以使用lock和unlock来操作。这种方法主要用来短期（长期的话性能差）地保护一些共享的数据。在mutex上阻塞会直接阻塞整个M，而不会和 go 的调度器进行交互。因此，在 runtime 中的最底层使用 mutex是安全的，因为它还会阻止相关联的G和P被重新调度（M都阻塞了，无法执行调度了）。rwmutex也是类似的。

如果是要进行一次性的通知，可以使用note。note提供了notesleep和notewakeup。不像传统的 UNIX 的sleep/wakeup，note是无竞争的（race-free），所以如果notewakeup已经发生了，那么notesleep将会立即返回。note可以在使用后通过noteclear来重置，但是要注意noteclear和notesleep、notewakeup不能发生竞争。类似mutex，阻塞在note上会阻塞整个M。然而，note提供了不同的方式来调用sleep：notesleep会阻止相关联的G和P被重新调度；notetsleepg的表现却像一个阻塞的系统调用一样，允许P被重用去运行另一个G。尽管如此，这仍然比直接阻塞一个G要低效，因为这需要消耗一个M。

如果需要直接和 go 调度器交互，可以使用gopark和goready。gopark挂起当前的 goroutine——把它变成waiting状态，并从调度器的运行队列中移除——然后调度另一个 goroutine 到当前的M或者P。goready将一个被挂起的 goroutine 恢复到runnable状态并将它放到运行队列中。

总结起来如下表：

	Blocks
Interface	G	M	P
(rw)mutex	Y	Y	Y
note	Y	Y	Y/N
park	Y	N	N

原子性

runtime 使用runtime/internal/atomic中自有的一些原子操作。这个和sync/atomic是对应的，除了方法名由于历史原因有一些区别，并且有一些额外的 runtime 需要的方法。

总的来说，我们对于 runtime 中 atomic 的使用非常谨慎，并且尽可能避免不需要的原子操作。如果对于一个变量的访问已经被另一种同步机制所保护，那么这个已经被保护的访问一般就不需要是原子的。这么做主要有以下原因：

合理地使用非原子和原子操作使得代码更加清晰可读，对于一个变量的原子操作意味着在另一处可能会有并发的对于这个变量的操作。
非原子的操作允许自动的竞争检测。runtime 本身目前并没有一个竞争检测器，但是未来可能会有。原子操作会使得竞争检测器忽视掉这个检测，但是非原子的操作可以通过竞争检测器来验证你的假设（是否会发生竞争）。
非原子的操作可以提高性能。

当然，所有对于一个共享变量的非原子的操作都应当在文档中注明该操作是如何被保护的。

有一些比较普遍的将原子操作和非原子操作混合在一起的场景有：

大部分操作都是读，且写操作被锁保护的变量。在锁保护的范围内，读操作没必要是原子的，但是写操作必须是原子的。在锁保护的范围外，读操作必须是原子的。
仅仅在 STW 期间发生的读操作，且 STW 期间不会有写操作。那么这个时候，读操作不需要是原子的。

话虽如此，Go Memory Model给出的建议仍然成立Don't be [too] clever。runtime 的性能固然重要，但是鲁棒性（robustness）却更加重要。

堆外内存（Unmanaged memory）

一般情况下，runtime 会尝试使用普通的方法来申请内存（堆上内存，gc 管理的），然而在某些情况 runtime 必须申请一些不被 gc 所管理的堆外内存（unmanaged memory）。这是很必要的，因为有可能该片内存就是内存管理器自身，或者说调用者没有一个P（译者注：比如在调度器初始化之前，是不存在P的）。

有三种方式可以申请堆外内存：

sysAlloc直接从操作系统获取内存，申请的内存必须是系统页表长度的整数倍。可以通过sysFree来释放。
persistentalloc将多个小的内存申请合并在一起为一个大的sysAlloc以避免内存碎片（fragmentation）。然而，顾名思义，通过persistentalloc申请的内存是无法被释放的。
fixalloc是一个SLAB风格的内存分配器，分配固定大小的内存。通过fixalloc分配的对象可以被释放，但是内存仅可以被相同的fixalloc池所重用。所以fixalloc适合用于相同类型的对象。

一般来说，使用任何这些分配的类型应通过嵌入runtime/internal/sys.NotInHeap来标记为非堆上类型。

在堆外内存所分配的对象不应该包含堆上的指针对象，除非同时遵守了以下的规则：

所有在堆外内存指向堆上的指针都必须是垃圾回收的根（garbage collection roots）。也就是说，所有指针必须可以通过一个全局变量所访问到，或者显式地使用runtime.markroot来标记。
如果内存被重用了，堆上的指针在被标记为 GC 根并且对 GC 可见前必须以 0 初始化（zero-initialized，见后文）。不然的话，GC 可能会观察到过期的（stale）堆指针。可以参见下文Zero-initialization versus zeroing.

Zero-initialization versus zeroing

在 runtime 中有两种类型的零初始化，取决于内存是否已经初始化为了一个类型安全的状态。

如果内存不在一个类型安全的状态，意思是可能由于刚被分配，并且第一次初始化使用，会含有一些垃圾值（译者注：这个概念在日常的 Go 代码中是遇不到的，如果学过 C 语言的同学应该能理解什么意思），那么这片内存必须使用memclrNoHeapPointers进行zero-initialized或者无指针的写。这不会触发写屏障（译者注：写屏障是 GC 中的一个概念）。

内存可以通过typedmemclr或者memclrHasPointers来写入零值，设置为类型安全的状态。这会触发写屏障。

Runtime-only 编译指令（compiler directives）

除了go doc compile中注明的//go:编译指令外，编译器在 runtime 包中支持了额外的一些指令。

go:systemstack

go:systemstack表明一个函数必须在系统栈上运行，这个会通过一个特殊的函数前引（prologue）动态地验证。

go:nowritebarrier

go:nowritebarrier告知编译器如果以下函数包含了写屏障，触发一个错误（这不会阻止写屏障的生成，只是单纯一个假设）。

一般情况下你应该使用go:nowritebarrierrec。go:nowritebarrier当且仅当“最好不要”写屏障，但是非正确性必须的情况下使用。

go:nowritebarrierrec 与 go:yeswritebarrierrec

go:nowritebarrierrec告知编译器如果以下函数以及它调用的函数（递归下去），直到一个go:yeswritebarrierrec为止，包含了一个写屏障的话，触发一个错误。

逻辑上，编译器会在生成的调用图上从每个go:nowritebarrierrec函数出发，直到遇到了go:yeswritebarrierrec的函数（或者结束）为止。如果其中遇到一个函数包含写屏障，那么就会产生一个错误。

go:nowritebarrierrec主要用来实现写屏障自身，用来避免死循环。

这两种编译指令都在调度器中所使用。写屏障需要一个活跃的P(getg().m.p != nil)，然而调度器相关代码有可能在没有一个活跃的P的情况下运行。在这种情况下，go:nowritebarrierrec会用在一些释放P或者没有P的函数上运行，go:yeswritebarrierrec会用在重新获取到了P的代码上。因为这些都是函数级别的注释，所以释放P和获取P的代码必须被拆分成两个函数。

go:uintptrkeepalive

//go:uintptrkeepalive 指令后面必须跟随一个函数声明。

它指定函数的 uintptr 参数可能是已转换为 uintptr 的指针值，并且在整个调用期间必须保持活动状态，即使从类型本身看在调用期间对象不再需要。

该指令类似于 //go:uintptrescapes，但不强制逃逸参数。由于堆栈增长不理解这些参数，此指令必须与 //go:nosplit 一起使用（在标记函数中以及所有传递参数的函数中），以防止堆栈增长。

从指针到 uintptr 的转换必须出现在此函数的任何调用参数列表中。此指令用于某些低级系统调用实现。

一种基于 gitlab 的适用于版本发布的 git-flow 协作规范

2019-11-06T09:09:25.000Z

最近自己搞了一个基于 gitlab 的适用于版本发布（非持续集成）的脱胎于 git-flow 的协作规范，发布出来大家可以作为借鉴。

Branch 规范

一共拥有以下几个（种）branch：

master：master 上的都是 production-ready 的 stable 的代码。
develop：作为开发的主分支，所有的 mr 都应当（先）合并到 develop 分支，定期 merge 到 master 发版。
release-*：LTS 版本需要有独立的 branch，以作为后续（万一）hotfix 使用，精确到 minor version，如 release-v1.2，为长期保留的分支。
feature/*：所有新的 feature（如新功能、性能优化）都应当先 checkout 到一个新的 feature 分支开发，原则上必须且只能 merge 到 develop 分支。
bugfix/*：bug 的修复分支，原则上必须且只能 merge 到 develop 分支。
test/*：test 分支主要做以下三件事：1. 增加 unit test；2. 修改仓库级别配置文件（如 .gitlab-ci.yml）；3. 用来承载一些一次性的测试（不合入 develop）。
hotfix/*：用来发布 hotfix 的分支，详见下节。
release/*：用来做发版工作（如更新版本号，bugfix）的分支，还有一个作用是 freeze feature，不允许合入 feature，可以合入 bugfix，详见下节。

branch name 应当采用下划线命名法。会在 ci 中对于 branch name 做强制检查，如果不合规会直接 fail。留出 test/* 的 branch 也是为了能够支持一些测试性的工作能够通过 ci 检查。

协作流程

开发流程

首先，确认自己在 develop 分支上；
git checkout -b feature/your_feature；
开发完成后，push 到 origin；
提 mr（如果是性能优化，请在 description 中附带上 benchcmp 的结果），target branch 为 develop，并勾选最下方两个选项：
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选：
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge：
done。

bugfix 流程

develop 上 bugfix

首先，确认自己在 develop 分支上；
git checkout -b bugfix/your_bugfix；
开发完成后，push 到 origin；
提 mr，target branch 为 develop，并如开发流程一样勾选最下方两个选项；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
done。

release/* 上 bugfix

这里不需要直接 merge 回 develop 是因为 release/* 最终会 merge 回 develop。

首先，确认自己在 release/vX.Y.Z 分支上；
git checkout -b bugfix/your_bugfix；
开发完成后，push 到 origin；
提 mr，target branch 为 release/vX.Y.Z，并如开发流程一样勾选最下方两个选项；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
done。

hotfix 流程

需要 merge 到 develop

按照 普通 bugfix 流程 完成 bug 修复，记得要更新代码中的版本号（为了防止 merge 到 master 后忘记 merge 回 develop）；
切换到 master 分支上；
git checkout -b hotfix/your_hotfix；
cherry-pick bugfix 的 commit；
检查无误后，push 到 origin；
提 mr，target branch 为 master，并如开发流程一样勾选最下方两个选项；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
切换到 master 分支上，打一个新的 tag；
done。

仅需要 merge 到 master

适用于需要修复的 bug 在 develop 分支上已不存在的情况。

版本号的更新不需要同步到develop，在下次merge的时候解决冲突即可。

首先，确认自己在 master 分支上；
git checkout -b hotfix/your_hotfix；
修复完成后，新增一个独立的commit，更新代码中版本号，push 到 origin；
提 mr，target branch 为 master，并如开发流程一样勾选最下方两个选项；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
切换到 master 分支上，打一个新的 tag；
将第三步中更新版本号的独立的commit cherry-pick到develop分支上；
done。

需要 merge 到 LTS release branch

根据情况，完成需要 merge 到 develop或者仅需要 merge 到 master中的一个；
切换到 release-vX.Y 分支上（待修复的分支）；
git checkout -b hotfix/your_hotfix；
cherry-pick hotfix 的 commit；
更新代码中版本号，检查无误后，push 到 origin；
提 mr，target branch 为 release-vX.Y，并如开发流程一样勾选最下方两个选项；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
切换到 release-vX.Y 分支上，打一个 tag；
done。

发版流程

发版流程比较特殊，和其它流程有较大区别，请注意细节。

这么做的原因是，如果先把 release branch merge 到 develop 分支上，再将 develop 分支 merge 进 master 的话，可能会带上预料之外的 commit（在整理 release 的时候有新的 mr 被 merge 到 develop）。

首先，确认自己在 develop 分支上；
git checkout -b release/vX.Y.Z；
做一些发版需要的工作（如更新版本号等）；
完成后，push 到 origin；
提 mr，target branch 为 master，**不勾选 squash 和 remove source branch**；
等待 review 通过，通过后点击 merge，请再次确认 squash 和 delete branch 未被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
切换到 master，打一个 vX.Y.Z 的 tag。
再提一个 mr，target branch 为 develop，**不勾选 squash，勾选 remove source branch**；
等待 review 通过，通过后点击 merge，再次确认不勾选 squash，但 delete branch 被勾选；
如果 merge request 有 description，可以点击 “Modify commit message” 并点击最下方的 include description，然后再点击 merge；
done。

CI check script

#!/usr/bin/env bash

echo "branch name is: $1"
if [[ ! $1 =~ ^(((feature|bugfix|test|hotfix)/.+)|(master|develop)|(release-v[0-9]+\.[0-9]+)|(release/v[0-9]+\.[0-9]+\.[0-9]+(-[a-z0-9.]+(\+[a-z0-9.]+)?)?))$ ]]; then
  echo "branch name invalid!" >&2
  exit 1
fi

Thrift相关概念学习笔记

2019-09-23T06:14:02.000Z

一直在工作中使用 Apache Thrift，但是一直对其中的一些概念一知半解，于是终于抽空学习了一下，记录下来作为学习笔记。

Thrift 网络层级

简单示意图如下：

+-------------------------------------------+
| Server                                    |
| (single-threaded, event-driven etc)       |
+-------------------------------------------+
| Processor                                 |
| (compiler generated)                      |
+-------------------------------------------+
| Protocol                                  |
| (JSON, compact etc)                       |
+-------------------------------------------+
| Transport                                 |
| (raw TCP, HTTP etc)                       |
+-------------------------------------------+

Transport

Transport层提供了一个读写底层网络的简单抽象，这使得Thrift可以把底层的网络传输和其它部分（比如序列化、反序列化）解耦开。

Transport主要包含以下接口：

open
close
read
write
flush

除了上面这个Transport的接口，Thrift还提供了一个ServerTransport的接口，用来accept或者create上面的Transport对象。顾名思义，ServerTransport主要用在服务端，用来接受连接并创建Transport对象。

ServerTransport主要包含以下接口：

open
listen
accept
close

Thrift主要支持的语言中有的部分接口示例如下：

file: read/write to/from a file on disk
http: 顾名思义

Protocol

Protocol层定义了序列化、反序列化的格式和方法，比如json、xml、plain text、compact binary等等。

Protocol的接口定义如下：

writeMessageBegin(name, type, seq)
writeMessageEnd()
writeStructBegin(name)
writeStructEnd()
writeFieldBegin(name, type, id)
writeFieldEnd()
writeFieldStop()
writeMapBegin(ktype, vtype, size)
writeMapEnd()
writeListBegin(etype, size)
writeListEnd()
writeSetBegin(etype, size)
writeSetEnd()
writeBool(bool)
writeByte(byte)
writeI16(i16)
writeI32(i32)
writeI64(i64)
writeDouble(double)
writeString(string)

name, type, seq = readMessageBegin()
                  readMessageEnd()
name = readStructBegin()
       readStructEnd()
name, type, id = readFieldBegin()
                 readFieldEnd()
k, v, size = readMapBegin()
             readMapEnd()
etype, size = readListBegin()
              readListEnd()
etype, size = readSetBegin()
              readSetEnd()
bool = readBool()
byte = readByte()
i16 = readI16()
i32 = readI32()
i64 = readI64()
double = readDouble()
string = readString()

Thrift Protocol在设计上就是以流为目标的，所以不需要任何显式的帧。比如，当我们在序列化一个string之前，我们不需要知道它有多长；同样的，当我们序列化一个list之前，不需要知道里面有几个item。部分Thrift主要支持语言所常用的Protocol如下：

binary: 非常简单的二进制编码，先编码长度和类型，然后编码真实的值。
compact: 参考THRIFT-110
json

Processor

Processor提供了从输入流读取数据以及写出到输出流的能力，输入和输出流都是由Protocol层实现，Processor本身很简单：

1
2
3

interface TProcessor {
    bool process(TProtocol in, TProtocol out) throws TException
}

每个服务的Processor都是由compiler生成的，Processor从输入流读取数据，扔给用户的handler处理，再把response写回输出流。

Server

Server把上述所有的特性组合在一起：

创建一个Transport
根据Transport创建输入输出流（Protocol）
基于输入输出流创建Processor
等待并处理连接

验证golang中unsafe包不安全

2019-04-02T05:32:28.000Z

在go中，uintptr不能持有对象，unsafe包不安全，但是我之前一直没有时间验证，今天写了段代码验证了一下。

代码

package main

import (
"fmt"
"unsafe"
)

func main() {
a := f()
b := f2()
fmt.Println(a)
fmt.Println(b)
}

//go:noinline
func f() unsafe.Pointer {
d := 1
p := unsafe.Pointer(&d)
return p
}

//go:noinline
func f2() uintptr {
d := 1
p := uintptr(unsafe.Pointer(&d))
return p
}

逃逸分析

根据逃逸分析可以看出来f和f2这两个函数中的d变量分别分配在哪里：

编译参数方法

$ go build -gcflags '-m -m' unsafe.go
# command-line-arguments
./unsafe.go:16:6: cannot inline f: marked go:noinline
./unsafe.go:23:6: cannot inline f2: marked go:noinline
./unsafe.go:8:6: cannot inline main: function too complex: cost 260 exceeds budget 80
./unsafe.go:11:13: inlining call to fmt.Println func(...interface {}) (int, error) { return fmt.Fprintln(io.Writer(os.Stdout), fmt.a...) }
./unsafe.go:12:13: inlining call to fmt.Println func(...interface {}) (int, error) { return fmt.Fprintln(io.Writer(os.Stdout), fmt.a...) }
./unsafe.go:18:22: &d escapes to heap
./unsafe.go:18:22: from p (assigned) at ./unsafe.go:18:4
./unsafe.go:18:22: from ~r0 (return) at ./unsafe.go:19:2
./unsafe.go:17:2: moved to heap: d
./unsafe.go:25:30: f2 &d does not escape
./unsafe.go:11:13: a escapes to heap
./unsafe.go:11:13: from ~arg0 (assign-pair) at ./unsafe.go:11:13
./unsafe.go:11:13: io.Writer(os.Stdout) escapes to heap
./unsafe.go:11:13: from io.Writer(os.Stdout) (passed to call[argument escapes]) at ./unsafe.go:11:13
./unsafe.go:12:13: io.Writer(os.Stdout) escapes to heap
./unsafe.go:12:13: from io.Writer(os.Stdout) (passed to call[argument escapes]) at ./unsafe.go:12:13
./unsafe.go:12:13: b escapes to heap
./unsafe.go:12:13: from ~arg0 (assign-pair) at ./unsafe.go:12:13
./unsafe.go:12:13: from []interface {} literal (slice-literal-element) at ./unsafe.go:12:13
./unsafe.go:12:13: from fmt.a (assigned) at ./unsafe.go:12:13
./unsafe.go:12:13: from *fmt.a (indirection) at ./unsafe.go:12:13
./unsafe.go:12:13: from fmt.a (passed to call[argument content escapes]) at ./unsafe.go:12:13
./unsafe.go:11:13: main []interface {} literal does not escape
./unsafe.go:12:13: main []interface {} literal does not escape
:1: os.(*File).close .this does not escape

可以看出来在函数f中，d逃逸到堆上；但是在函数f2中，d没有发生逃逸，uintptr没有持有对象。

汇编

再来看看汇编的结果：

$ go tool compile -S unsafe.go | grep unsafe.go:24
0x000e 00014 (unsafe.go:24)PCDATA$2, $0
0x000e 00014 (unsafe.go:24)PCDATA$0, $0
0x000e 00014 (unsafe.go:24)MOVQ$1, "".d(SP)
$ go tool compile -S unsafe.go | grep unsafe.go:17
0x001d 00029 (unsafe.go:17)PCDATA$2, $1
0x001d 00029 (unsafe.go:17)PCDATA$0, $0
0x001d 00029 (unsafe.go:17)LEAQtype.int(SB), AX
0x0024 00036 (unsafe.go:17)PCDATA$2, $0
0x0024 00036 (unsafe.go:17)MOVQAX, (SP)
0x0028 00040 (unsafe.go:17)CALLruntime.newobject(SB)
0x002d 00045 (unsafe.go:17)PCDATA$2, $1
0x002d 00045 (unsafe.go:17)MOVQ8(SP), AX
0x0032 00050 (unsafe.go:17)MOVQ$1, (AX)

可以看出来，结果也是一样的，f中的d调用了newobject，但是f2中没有。

结论

所以为什么说unsafe包不安全呢，原因之一就是因为go不保证地址一定是有效的，当然还有其它的原因，有时间再验证分享。

golang 的 GC 如何处理 unsafe.Pointer？

2019-04-01T12:42:37.000Z

最近在golang的邮件列表中看到了一篇关于GC如何处理unsafe.Pointer的讨论，觉得应当记录一下。

问题1：如果一个对象只被unsafe.Pointer所指向，那么这个对象会被回收么？

回答1：不会。如果unsafe.Pointer指向了一个对象，那么go的GC会知道有这个对象，并且不会释放这个对象的内存。

但是注意，有一个例外：如果这个对象的内存是在go外被分配的（比如C.malloc），那么以上的规则不生效。

问题2：如果这个对象内部也有一些指针，那么GC会如何处理这些指针？

回答2：如果这个对象是在go内部分配的，那么GC也会遍历这些指针（也就是不会被释放）。

问题3：如果在以上两个问题中，对象都不会被释放，那么GC是怎么处理的？unsafe.Pointer会存对象的类型信息么？

回答3：不会存类型信息，但是如果对象是在go中申请的，那么在对应的内存中是会存有类型信息的；如果没有类型信息，那么GC会采用非常保守的策略：遍历整个对象，只要其中有8bit的值是合法的内存地址（在栈范围内，或者在堆上），就认为是指针，不会进行回收。

问题4：有没有一种情况unsafe.Pointer会变成非法的（野指针）？

回答4：在go中，只要unsafe.Pointer有一刻是合法的，并且它的值没有修改，那么go会保证它在整个程序的生命周期中都是合法的。在unsafe.Pointer和unsafe.Pointer间的赋值一定是安全的，但是间接的赋值（比如同过uintptr）可能是非法的，因为uintptr不被认为持有了对象。

go会忽视所有非go分配的对象（比如C.malloc），所以如果在C中有一个指针指向的地址包含了go的对象，那么必须保证这个指针在go中也被一个对象存储下来。

原文

源码剖析golang中sync.Mutex

2019-03-28T13:01:18.000Z

go语言以并发作为其特性之一，并发必然会带来对于资源的竞争，这时候我们就需要使用go提供的sync.Mutex这把互斥锁来保证临界资源的访问互斥。

既然经常会用这把锁，那么了解一下其内部实现，就能了解这把锁适用什么场景，特性如何了。

引子

在看sync.Mutex的代码的时候，一定要记住，同时会有多个goroutine会来要这把锁，所以锁的状态state是可能会一直更改的。

锁的性质

先说结论：sync.Mutex是把公平锁。

在源代码中，有一段注释：

// Mutex fairness.
//
// Mutex can be in 2 modes of operations: normal and starvation.
// In normal mode waiters are queued in FIFO order, but a woken up waiter
// does not own the mutex and competes with new arriving goroutines over
// the ownership. New arriving goroutines have an advantage -- they are
// already running on CPU and there can be lots of them, so a woken up
// waiter has good chances of losing. In such case it is queued at front
// of the wait queue. If a waiter fails to acquire the mutex for more than 1ms,
// it switches mutex to the starvation mode.
//
// In starvation mode ownership of the mutex is directly handed off from
// the unlocking goroutine to the waiter at the front of the queue.
// New arriving goroutines don't try to acquire the mutex even if it appears
// to be unlocked, and don't try to spin. Instead they queue themselves at
// the tail of the wait queue.
//
// If a waiter receives ownership of the mutex and sees that either
// (1) it is the last waiter in the queue, or (2) it waited for less than 1 ms,
// it switches mutex back to normal operation mode.
//
// Normal mode has considerably better performance as a goroutine can acquire
// a mutex several times in a row even if there are blocked waiters.
// Starvation mode is important to prevent pathological cases of tail latency.

看懂这段注释对于我们理解mutex这把锁有很大的帮助，这里面讲了这把锁的设计理念。大致意思如下：

// 公平锁
//
// 锁有两种模式：正常模式和饥饿模式。
// 在正常模式下，所有的等待锁的goroutine都会存在一个先进先出的队列中（轮流被唤醒）
// 但是一个被唤醒的goroutine并不是直接获得锁，而是仍然需要和那些新请求锁的（new arrivial）
// 的goroutine竞争，而这其实是不公平的，因为新请求锁的goroutine有一个优势——它们正在CPU上
// 运行，并且数量可能会很多。所以一个被唤醒的goroutine拿到锁的概率是很小的。在这种情况下，
// 这个被唤醒的goroutine会加入到队列的头部。如果一个等待的goroutine有超过1ms（写死在代码中）
// 都没获取到锁，那么就会把锁转变为饥饿模式。
//
// 在饥饿模式中，锁的所有权会直接从释放锁(unlock)的goroutine转交给队列头的goroutine，
// 新请求锁的goroutine就算锁是空闲状态也不会去获取锁，并且也不会尝试自旋。它们只是排到队列的尾部。
//
// 如果一个goroutine获取到了锁之后，它会判断以下两种情况：
// 1. 它是队列中最后一个goroutine；
// 2. 它拿到锁所花的时间小于1ms；
// 以上只要有一个成立，它就会把锁转变回正常模式。

// 正常模式会有比较好的性能，因为即使有很多阻塞的等待锁的goroutine，
// 一个goroutine也可以尝试请求多次锁。
// 饥饿模式对于防止尾部延迟来说非常的重要。

在下一步真正看源代码之前，我们必须要理解一点：当一个goroutine获取到锁的时候，有可能没有竞争者，也有可能会有很多竞争者，那么我们就需要站在不同的goroutine的角度上去考虑goroutine看到的锁的状态和实际状态、期望状态之间的转化。

字段定义

sync.Mutex只包含两个字段：

// A Mutex is a mutual exclusion lock.
// The zero value for a Mutex is an unlocked mutex.
//
// A Mutex must not be copied after first use.
type Mutex struct {
state int32
semauint32
}

const (
mutexLocked = 1 << iota // mutex is locked
mutexWoken
mutexStarving
mutexWaiterShift = iota

starvationThresholdNs = 1e6
)

其中state是一个表示锁的状态的字段，这个字段会同时被多个goroutine所共用（使用atomic.CAS来保证原子性），第0个bit（1）表示锁已被获取，也就是已加锁，被某个goroutine拥有；第1个bit（2）表示有goroutine被唤醒，尝试获取锁；第2个bit（4）标记这把锁是否为饥饿状态。

sema字段就是用来唤醒goroutine所用的信号量。

Lock

在看代码之前，我们需要有一个概念：每个goroutine也有自己的状态，存在局部变量里面（也就是函数栈里面），goroutine有可能是新到的、被唤醒的、正常的、饥饿的。

atomic.CAS

先看一下最基础的一行代码加锁的CAS操作：

// Lock locks m.
// If the lock is already in use, the calling goroutine
// blocks until the mutex is available.
func (m *Mutex) Lock() {
// Fast path: grab unlocked mutex.
if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
if race.Enabled {
race.Acquire(unsafe.Pointer(m))
}
return
}
...
}

这是第一段代码，这段代码调用了atomic包中的CompareAndSwapInt32这个方法来尝试快速获取锁，这个方法的签名如下：

1 2	// CompareAndSwapInt32 executes the compare-and-swap operation for an int32 value. func CompareAndSwapInt32(addr *int32, old, new int32) (swapped bool)

意思是，如果addr指向的地址中存的值和old一样，那么就把addr中的值改为new并返回true；否则什么都不做，返回false。由于是atomic中的函数，所以是保证了原子性的。

我们来具体看看CAS的实现（src/runtime/internal/atomic/asm_amd64.s）：

// bool Cas(int32 *val, int32 old, int32 new)
// Atomically:
//if(*val == old){
//*val = new;
//return 1;
//} else
//return 0;
// 这里参数及返回值大小加起来是17，是因为一个指针在amd64下是8字节，
// 然后int32分别是占用4字节，最后的返回值是bool占用1字节，所以加起来是17
TEXT runtime∕internal∕atomic·Cas(SB),NOSPLIT,$0-17 
// 为什么不把*val指针放到AX中呢？因为AX有特殊用处，
// 在下面的CMPXCHGL里面，会从AX中读取要比较的其中一个数
MOVQptr+0(FP), BX
// 所以AX要用来存参数old
MOVLold+8(FP), AX
// 把new中的数存到寄存器CX中
MOVLnew+12(FP), CX
// 注意这里了，这里使用了LOCK前缀，所以保证操作是原子的
LOCK
// 0(BX) 可以理解为 *val
// 把 AX中的数 和 第二个操作数 0(BX)——也就是BX寄存器所指向的地址中存的值 进行比较
// 如果相等，就把 第一个操作数 CX寄存器中存的值 赋给 第二个操作数 BX寄存器所指向的地址
// 并将标志寄存器ZF设为1
// 否则将标志寄存器ZF清零
CMPXCHGLCX, 0(BX)
// SETE的作用是：
// 如果Zero Flag标志寄存器为1，那么就把操作数设为1
// 否则把操作数设为0
// 也就是说，如果上面的比较相等了，就返回true，否则为false
// ret+16(FP)代表了返回值的地址
SETEQret+16(FP)
RET

如果看不懂也没太大关系，只要知道这个函数的作用，以及这个函数是原子性的即可。

那么这段代码的意思就是：先看看这把锁是不是空闲状态，如果是的话，直接原子性地修改一下state为已被获取就行了。多么简洁（虽然后面的代码并不是……）！

主流程

接下来具体看主流程的代码，代码中有一些位运算看起来比较晕，我会试着用伪代码在边上注释。

// Lock locks m.
// If the lock is already in use, the calling goroutine
// blocks until the mutex is available.
func (m *Mutex) Lock() {
// Fast path: grab unlocked mutex.
if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
if race.Enabled {
race.Acquire(unsafe.Pointer(m))
}
return
}

// 用来存当前goroutine等待的时间
var waitStartTime int64
// 用来存当前goroutine是否饥饿
starving := false
// 用来存当前goroutine是否已唤醒
awoke := false
// 用来存当前goroutine的循环次数(想一想一个goroutine如果循环了2147483648次咋办……)
iter := 0
// 复制一下当前锁的状态
old := m.state
// 自旋
for {
// 如果是饥饿情况之下，就不要自旋了，因为锁会直接交给队列头部的goroutine
// 如果锁是被获取状态，并且满足自旋条件（canSpin见后文分析），那么就自旋等锁
// 伪代码：if isLocked() and isNotStarving() and canSpin()
if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
// 将自己的状态以及锁的状态设置为唤醒，这样当Unlock的时候就不会去唤醒其它被阻塞的goroutine了
if !awoke && old&mutexWoken == 0 && old>>mutexWaiterShift != 0 &&
atomic.CompareAndSwapInt32(&m.state, old, old|mutexWoken) {
awoke = true
}
// 进行自旋(分析见后文)
runtime_doSpin()
iter++
// 更新锁的状态(有可能在自旋的这段时间之内锁的状态已经被其它goroutine改变)
old = m.state
continue
}

// 当走到这一步的时候，可能会有以下的情况：
// 1. 锁被获取+饥饿
// 2. 锁被获取+正常
// 3. 锁空闲+饥饿
// 4. 锁空闲+正常

// goroutine的状态可能是唤醒以及非唤醒

// 复制一份当前的状态，目的是根据当前状态设置出期望的状态，存在new里面，
// 并且通过CAS来比较以及更新锁的状态
// old用来存锁的当前状态
new := old

// 如果说锁不是饥饿状态，就把期望状态设置为被获取(获取锁)
// 也就是说，如果是饥饿状态，就不要把期望状态设置为被获取
// 新到的goroutine乖乖排队去
// 伪代码：if isNotStarving()
if old&mutexStarving == 0 {
// 伪代码：newState = locked
new |= mutexLocked
}
// 如果锁是被获取状态，或者饥饿状态
// 就把期望状态中的等待队列的等待者数量+1(实际上是new + 8)
// (会不会可能有三亿个goroutine等待拿锁……)
if old&(mutexLocked|mutexStarving) != 0 {
new += 1 << mutexWaiterShift
}
// 如果说当前的goroutine是饥饿状态，并且锁被其它goroutine获取
// 那么将期望的锁的状态设置为饥饿状态
// 如果锁是释放状态，那么就不用切换了
// Unlock期望一个饥饿的锁会有一些等待拿锁的goroutine，而不只是一个
// 这种情况下不会成立
if starving && old&mutexLocked != 0 {
// 期望状态设置为饥饿状态
new |= mutexStarving
}
// 如果说当前goroutine是被唤醒状态，我们需要reset这个状态
// 因为goroutine要么是拿到锁了，要么是进入sleep了
if awoke {
// 如果说期望状态不是woken状态，那么肯定出问题了
// 这里看不懂没关系，wake的逻辑在下面
if new&mutexWoken == 0 {
throw("sync: inconsistent mutex state")
}
// 这句就是把new设置为非唤醒状态
// &^的意思是and not
new &^= mutexWoken
}
// 通过CAS来尝试设置锁的状态
// 这里可能是设置锁，也有可能是只设置为饥饿状态和等待数量
if atomic.CompareAndSwapInt32(&m.state, old, new) {
// 如果说old状态不是饥饿状态也不是被获取状态
// 那么代表当前goroutine已经通过CAS成功获取了锁
// (能进入这个代码块表示状态已改变，也就是说状态是从空闲到被获取)
if old&(mutexLocked|mutexStarving) == 0 {
break // locked the mutex with CAS
}
// 如果之前已经等待过了，那么就要放到队列头
queueLifo := waitStartTime != 0
// 如果说之前没有等待过，就初始化设置现在的等待时间
if waitStartTime == 0 {
waitStartTime = runtime_nanotime()
}
// 既然获取锁失败了，就使用sleep原语来阻塞当前goroutine
// 通过信号量来排队获取锁
// 如果是新来的goroutine，就放到队列尾部
// 如果是被唤醒的等待锁的goroutine，就放到队列头部
runtime_SemacquireMutex(&m.sema, queueLifo)

// 这里sleep完了，被唤醒

// 如果当前goroutine已经是饥饿状态了
// 或者当前goroutine已经等待了1ms（在上面定义常量）以上
// 就把当前goroutine的状态设置为饥饿
starving = starving || runtime_nanotime()-waitStartTime > starvationThresholdNs
// 再次获取一下锁现在的状态
old = m.state
// 如果说锁现在是饥饿状态，就代表现在锁是被释放的状态，当前goroutine是被信号量所唤醒的
// 也就是说，锁被直接交给了当前goroutine
if old&mutexStarving != 0 {
// 如果说当前锁的状态是被唤醒状态或者被获取状态，或者说等待的队列为空
// 那么是不可能的，肯定是出问题了，因为当前状态肯定应该有等待的队列，锁也一定是被释放状态且未唤醒
if old&(mutexLocked|mutexWoken) != 0 || old>>mutexWaiterShift == 0 {
throw("sync: inconsistent mutex state")
}
// 当前的goroutine获得了锁，那么就把等待队列-1
delta := int32(mutexLocked - 1<
// 如果当前goroutine非饥饿状态，或者说当前goroutine是队列中最后一个goroutine
// 那么就退出饥饿模式，把状态设置为正常
if !starving || old>>mutexWaiterShift == 1 {
// Exit starvation mode.
// Critical to do it here and consider wait time.
// Starvation mode is so inefficient, that two goroutines
// can go lock-step infinitely once they switch mutex
// to starvation mode.
delta -= mutexStarving
}
// 原子性地加上改动的状态
atomic.AddInt32(&m.state, delta)
break
}
// 如果锁不是饥饿模式，就把当前的goroutine设为被唤醒
// 并且重置iter(重置spin)
awoke = true
iter = 0
} else {
// 如果CAS不成功，也就是说没能成功获得锁，锁被别的goroutine获得了或者锁一直没被释放
// 那么就更新状态，重新开始循环尝试拿锁
old = m.state
}
}

if race.Enabled {
race.Acquire(unsafe.Pointer(m))
}
}

以上为什么CAS能拿到锁呢？因为CAS会原子性地判断old state和当前锁的状态是否一致；而总有一个goroutine会满足以上条件成功拿锁。

canSpin

接下来我们来看看上文提到的canSpin条件如何：

// Active spinning for sync.Mutex.
//go:linkname sync_runtime_canSpin sync.runtime_canSpin
//go:nosplit
func sync_runtime_canSpin(i int) bool {
// 这里的active_spin是个常量，值为4
// 简单来说，sync.Mutex是有可能被多个goroutine竞争的，所以不应该大量自旋(消耗CPU)
// 自旋的条件如下：
// 1. 自旋次数小于active_spin(这里是4)次；
// 2. 在多核机器上；
// 3. GOMAXPROCS > 1并且至少有一个其它的处于运行状态的P；
// 4. 当前P没有其它等待运行的G；
// 满足以上四个条件才可以进行自旋。
if i >= active_spin || ncpu <= 1 || gomaxprocs <= int32(sched.npidle+sched.nmspinning)+1 {
return false
}
if p := getg().m.p.ptr(); !runqempty(p) {
return false
}
return true
}

所以可以看出来，并不是一直无限自旋下去的，当自旋次数到达4次或者其它条件不符合的时候，就改为信号量拿锁了。

doSpin

然后我们来看看doSpin的实现（其实也没啥好看的）：

//go:linkname sync_runtime_doSpin sync.runtime_doSpin
//go:nosplit
func sync_runtime_doSpin() {
procyield(active_spin_cnt)
}

这是一个汇编实现的函数，简单看两眼amd64上的实现：

TEXT runtime·procyield(SB),NOSPLIT,$0-0
MOVLcycles+0(FP), AX
again:
PAUSE
SUBL$1, AX
JNZagain
RET

看起来没啥好看的，直接跳过吧。

Unlock

接下来我们来看看Unlock的实现，对于Unlock来说，有两个比较关键的特性：

如果说锁不是处于locked状态，那么对锁执行Unlock会导致panic；
锁和goroutine没有对应关系，所以我们完全可以在goroutine 1中获取到锁，然后在goroutine 2中调用Unlock来释放锁（这是什么骚操作！）（虽然不推荐大家这么干……）

func (m *Mutex) Unlock() {
if race.Enabled {
_ = m.state
race.Release(unsafe.Pointer(m))
}

// Fast path: drop lock bit.
// 这里获取到锁的状态，然后将状态减去被获取的状态(也就是解锁)，称为new(期望)状态
// 注意以上两个操作是原子的，所以不用担心多个goroutine并发的问题
new := atomic.AddInt32(&m.state, -mutexLocked)
// 如果说，期望状态加上被获取的状态，不是被获取的话
// 那么就panic
// 在这里给大家提一个问题：干嘛要这么大费周章先减去再加上，直接比较一下原来锁的状态是否被获取不就完事了？
if (new+mutexLocked)&mutexLocked == 0 {
throw("sync: unlock of unlocked mutex")
}
// 如果说new状态(也就是锁的状态)不是饥饿状态
if new&mutexStarving == 0 {
// 复制一下原先状态
old := new
for {
// 如果说锁没有等待拿锁的goroutine
// 或者锁被获取了(在循环的过程中被其它goroutine获取了)
// 或者锁是被唤醒状态(表示有goroutine被唤醒，不需要再去尝试唤醒其它goroutine)
// 或者锁是饥饿模式(会直接转交给队列头的goroutine)
// 那么就直接返回，啥都不用做了
if old>>mutexWaiterShift == 0 || old&(mutexLocked|mutexWoken|mutexStarving) != 0 {
return
}
// 走到这一步的时候，说明锁目前还是空闲状态，并且没有goroutine被唤醒且队列中有goroutine等待拿锁
// 那么我们就要把锁的状态设置为被唤醒，等待队列-1
new = (old - 1<
// 又是熟悉的CAS
if atomic.CompareAndSwapInt32(&m.state, old, new) {
// 如果状态设置成功了，我们就通过信号量去唤醒goroutine
runtime_Semrelease(&m.sema, false)
return
}
// 循环结束的时候，更新一下状态，因为有可能在执行的过程中，状态被修改了(比如被Lock改为了饥饿状态)
old = m.state
}
} else {
// 如果是饥饿状态下，那么我们就直接把锁的所有权通过信号量移交给队列头的goroutine就好了
// handoff = true表示直接把锁交给队列头部的goroutine
// 注意：在这个时候，锁被获取的状态没有被设置，会由被唤醒的goroutine在唤醒后设置
// 但是当锁处于饥饿状态的时候，我们也认为锁是被获取的(因为我们手动指定了获取的goroutine)
// 所以说新来的goroutine不会尝试去获取锁(在Lock中有体现)
runtime_Semrelease(&m.sema, true)
}
}

总结

根据以上代码的分析，可以看出，sync.Mutex这把锁在你的工作负载（所需时间）比较低，比如只是对某个关键变量赋值的时候，性能还是比较好的，但是如果说对于临界资源的操作耗时很长（特别是单个操作就大于1ms）的话，实际上性能上会有一定的问题，这也就是我们经常看到“的锁一直处于饥饿状态”的问题，对于这种情况，可能就需要另寻他法了。

好了，至此整个sync.Mutex的分析就此结束了，虽然只有短短200行代码（包括150行注释，实际代码估计就50行），但是其中的算法、设计的思想、编程的理念却是值得感悟，所谓大道至简、少即是多可能就是如此吧。

golang逃逸分析

2019-03-24T16:22:51.000Z

带GC语言给我们程序的编写带来了极大的便利，但是与此同时屏蔽了很多底层的细节，比如一个对象是在栈上分配还是在堆上分配。对于普通的代码来说虽然不需要关心这么多，但是作为强迫症程序猿，还是希望能让自己写出来的代码性能最优，所以还是需要了解什么是逃逸，以及如何判断是否发生了逃逸。

什么是堆和栈？

首先需要知道，我们说的堆和栈是啥。这个可不是数据结构里面的”堆”和”栈”，而是操作系统里面的概念。

栈

在程序中，每个函数块都会有自己的内存区域用来存自己的局部变量（内存占用少）、返回地址、返回值之类的数据，这一块内存区域有特定的结构和寻址方式，大小在编译时已经确定，寻址起来也十分迅速，开销很少。这一块内存地址称为栈。栈是线程级别的，大小在创建的时候已经确定，所以当数据太大的时候，就会发生”stack overflow”。

堆

在程序中，全局变量、内存占用大的局部变量、发生了逃逸的局部变量存在的地方就是堆，这一块内存没有特定的结构，也没有固定的大小，可以根据需要进行调整。简单来说，有大量数据要存的时候，就存在堆里面。堆是进程级别的。当一个变量需要分配在堆上的时候，开销会比较大，对于go这种带GC的语言来说，也会增加gc压力，同时也容易造成内存碎片。

为什么有的变量要分配在堆，有的要分配在栈？

这个问题要从C++说起了。在C++中，假设我们有以下代码：

int* f1() {
  int i = 5;
  return &i;
}

int main() {
  int *i = f1();
  *i = 6;
  return 0;
}

这时候程序结果是无法预期的，因为在函数f1中，i是一个局部变量，会分配在栈上，而栈在函数返回之后就失效了(Plan9 汇编中SP指针被修改)，于是i的地址所存的值是不可预期的，后续在main中对返回的i的地址中的值的修改可能会修改掉程序运行的数据，造成结果无法预期。

所以对于需要返回一个地址回去的情况，在C++中需要用new来分配一块堆上的内存才行，因为堆是进程级别的，也就是全局的，除非程序猿手动释放，否则不会被回收（释放不好会段错误，忘了释放会内存泄漏），于是就可以使得这个地址不会再被使用到，可以安全地返回。

如何进行逃逸分析？

在golang中，所有内存都是由runtime管理的，程序猿不需要关心具体变量分配在哪里，什么时候回收，但是编译器需要知道这一点，这样才能确定函数栈帧大小、哪些变量需要”new”在堆上，所以编译器需要进行逃逸分析。简单来说，逃逸分析决定了一个变量是分配在栈上还是分配在堆上。

golang逃逸分析最基本的原则是：如果一个函数返回的是一个（局部）变量的地址，那么这个变量就发生逃逸。

在golang里面，变量分配在何处和是否使用new无关，意味着程序猿无法手动指定某个变量必须分配在栈上或者堆上(自己撸asm的当我没说)，所以我们需要通过一些方法来确定某个变量到底是分配在了栈上还是堆上。

我们用以下代码作为例子：

package main

func main() {
a := f1()
*a++
}

//go:noinline
func f1() *int {
i := 1
return &i
}

在以上代码中，给f1增加了noinline标记，让go编译器不要将函数内联。

使用编译参数

golang提供了编译的参数让我们可以直观地看到变量是否发生了逃逸，只需要在go build时指定 -gcflags '-m'即可：

$ go build -gcflags '-m' escape.go
# command-line-arguments
./escape.go:3:6: can inline main
./escape.go:11:9: &i escapes to heap
./escape.go:10:2: moved to heap: i

这样可以很直观地看到在第10、11行，i发生了逃逸，内存会分配在堆上。

除了使用编译参数之外，我们还可以使用一种更底层的，更硬核，也更准确的方式来判断一个对象是否逃逸，那就是：直接看汇编！

使用汇编

我们使用go tool compile -S生成汇编代码：

$ go tool compile -S escape.go | grep escape.go:10
0x001d 00029 (escape.go:10)PCDATA$2, $1
0x001d 00029 (escape.go:10)PCDATA$0, $0
0x001d 00029 (escape.go:10)LEAQtype.int(SB), AX
0x0024 00036 (escape.go:10)PCDATA$2, $0
0x0024 00036 (escape.go:10)MOVQAX, (SP)
0x0028 00040 (escape.go:10)CALLruntime.newobject(SB)
0x002d 00045 (escape.go:10)PCDATA$2, $1
0x002d 00045 (escape.go:10)MOVQ8(SP), AX
0x0032 00050 (escape.go:10)MOVQ$1, (AX)

可以看到，这里的00040有调用runtime.newobject(SB)这个方法，看到这个方法大家就应该懂了！

总结

以上提供了两种方法可以用来判断某个变量是否发生了逃逸，其中使用编译参数比较简单，使用汇编比较硬核。通过这两种方法分析完逃逸，就能进一步优化堆上内存数量，减轻GC压力了。

算法详解：最长上升子序列

2018-07-24T16:46:52.000Z

题目描述

给定一个长度为n的数列a0, a1, a2...an-1，求出这个序列中的最长的上升子序列的长度，上升子序列的定义为：对于任意的i，都满足ai。

限制条件：1≤n≤1000，0≤a≤1000000
样例：
输入：
1
2
n = 5
a = {4, 2, 3, 1, 5}
输出：
1
3（a1, a2, a4构成的子序列2，3，5最长）
题解
这个问题就是著名的最长上升子序列（LIS，Longest  Increasing Subsequence）问题，这个问题有两种解法，第一种解法是O(n²)的DP解法，第二种解法是O(nlogn)的DP加二分解法。
O(n²)算法
首先我们可以来建立一下DP的递推关系：
1
定义dp[i]:=以ai为末尾的最长上升子序列的长度
以ai结尾的上升子序列是：
1
2
只包含ai的子序列
在满足jajaj为结尾的上升子列末尾，追加上ai后得到的子序列
这二者之一。这样就能得到如下的递推关系：
1
dp[i]=max{1, dp[j]+1|j
使用这个递推公式可以在O(n²)时间内解决这个问题。
代码如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
// 输入
int n;
int a[MAX_N];

int dp[MAX_N];

void solve() {
    int res = 0;
    for (int i = 0; i < n; i++) {
        dp[i] = 1;
        for(int j = 0; j < i; j++) {
            if (a[j] < a[i]) {
                dp[i] = max(dp[i], dp[j] + 1);
            }
        }
        res = max(res, dp[i]);
    }
    printf("%d\n", res);
}
这个方法比较简单，但是时间复杂度也比较高。下面我们来看看更优的解法。
O(nlogn)
之前我们的思路是求出以第i个元素为结尾的最长上升子序列长度，我们可以换个思路，考虑一下dp[i]为最长上升子序列长度为i情况下最小的元素，这样我们就可以通过二分来进行优化，代码如下：
1
2
3
4
5
6
7
8
9
int dp[MAX_N];

void solve() {
    fill(dp, dp+n, INF);
    for (int i = 0; i < n; i++) {
        *lower_bound(dp, dp + n, a[i]) = a[i];
    }
    printf("%d\n", lower_bound(dp, dp + n, INF) - dp);
}



LintCode 428. x的n次幂
2018-07-11T08:43:16.000Z
题意
实现 pow(x,n)
注意事项
不用担心精度，当答案和标准输出差绝对值小于1e-3时都算正确
样例
1
2
3
Pow(2.1, 3) = 9.261
Pow(0, 1) = 0
Pow(1, 0) = 1
思路
从数学上来说，(x)的4次方 等于 (x的平方)的平方。我们使用这个思想来做这道题就行了。
其实就和把十进制数转成二进制的思想是一样的。
需要注意的地方是，n可能为负数。
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
class Solution:
    """
    @param: x: the base number
    @param: n: the power number
    @return: the result
    """
    def myPow(self, x, n):
        if n == 0:
            return 1
        if x == 0:
            return 0
        t = x
        if n < 0:
            t = 1 / t
            n = -n
        ans = 1
        while n != 0:
            if n % 2 != 0:
                ans *= t
            t *= t
            n = int(n / 2)
        return ans



LintCode 460.在排序数组中找最接近的K个数
2018-07-11T08:15:34.000Z
题意
给一个目标数 target, 一个非负整数 k, 一个按照升序排列的数组 A。在A中找与target最接近的k个整数。返回这k个数并按照与target的接近程度从小到大排序，如果接近程度相当，那么小的数排在前面。
注意事项
The value k is a non-negative integer and will always be smaller than the length of the sorted array.
Length of the given array is positive and will not exceed 10^4
Absolute value of elements in the array and x will not exceed 10^4
样例
如果 A = [1, 2, 3], target = 2 and k = 3, 那么返回 [2, 1, 3].
如果 A = [1, 4, 6, 8], target = 3 and k = 3, 那么返回 [4, 1, 6].
思路
这道题的一般解法都很容易想出来，暴力出奇迹嘛，这里我们只说最优解，也就是 O(logn + k) 的时间复杂度 的解法。
这道题的解题关键是数组A是有序的，只要有序就可以考虑用二分。
我们通过对A进行二分，找到最接近target的数，找到之后用双指针的思想，依次从找到的那个数向两边扩散，直到满足k个数为止。
思路较为简单，编码过程注意一些边界条件的判断即可。
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
class Solution:
    """
    @param A: an integer array
    @param target: An integer
    @param k: An integer
    @return: an integer array
    """
    def kClosestNumbers(self, A, target, k):
        if k == 0:
            return []
        if not A:
            return []
        lp = None
        rp = None
        start = 0
        end = len(A) - 1
        while start + 1 < end:
            mid = int(start + (end - start) / 2)
            if A[mid] == target:
                start = mid
                end = mid + 1
                break
            elif A[mid] < target:
                start = mid
            else:
                end = mid
        if abs(A[start] - target) <= abs(A[start] - target):
            lp = start
            rp = end
        else:
            lp = end
            rp = end + 1
        cnt = 0
        ans = list()
        while cnt < k:
            cnt += 1
            if lp < 0 and rp >= len(A):
                return []
            elif lp < 0:
                ans.append(A[rp])
                rp += 1
            elif rp >= len(A):
                ans.append(A[lp])
                lp -= 1
            elif abs(A[lp] - target) <= abs(A[rp] - target):
                ans.append(A[lp])
                lp -= 1
            else:
                ans.append(A[rp])
                rp += 1
        return ans



Service Mesh Istio 初探
2018-06-27T03:41:13.000Z
早在去年，Service Mesh这个概念就开始火起来了，今年的时候Service Mesh更是爆发式地发展，Service Mesh中的明星项目Istio更是只用了几个月的时间就已经从0.1到了0.8 LTS了。由于工作和毕业的压力，之前一直没有时间深入研究Service Mesh。现在稍微有些时间了，所以打算写点什么关于Service Mesh的。
介绍
首先，我们需要了解一下什么是Service Mesh。今天我们的主角是Istio，Istio的背景我不过多介绍，G家等大厂搞出来并且在后面推动支持的肯定不会弱。
根据Istio的官方文档，是这么定义自己的：一个用来连接、管理和加密微服务（流量）的开放平台。
an open platform to connect, manage, and secure microservices
Istio可以让你在不修改微服务源代码的情况之下，很轻松地给微服务加上诸如负载均衡、身份验证、监控等等的功能。Istio通过在你的微服务中部署一个sidecar作为所有流量的代理来达成这个目标。
总结下来，Istio提供了以下功能：
流量管理（Traffic Management）
服务的身份认证和安全（Service Identity and Security）
策略配置（Policy Enforcement）
遥感（Telemetry）
除了这些之外，Istio还支持很多不同的平台（尤其是Kubernetes），并且支持自定义的组件和集成。
通过这些功能，微服务的开发和迁移会变得非常容易，而运维人员也可以更方便的更改部署的策略。
架构
Istio是两层架构的，分别是数据层和控制层：
数据层是由所有的部署为sidecar的Envoy所组成的。
控制层有三个组件：Pilot、Mixer和Citadel，顾名思义是用来控制Service Mesh的行为的。
总体的架构如下图：
Envoy
Istio用了一个扩展版本的Envoy作为底层的代理。Envoy是一个用C++开发的高性能的代理，具有非常多功能，具体的可以参考官方文档，在此不做赘述。
Envoy在Istio中是以sidecar模式部署在pod里面的，Istio通过控制Envoy来控制所有的流量，获取监控数据等。
Mixer
Mixer是一个平台无关的组件，用来控制访问策略和使用策略，同时会收集监控信息，将收集到的信息传给用户可以自定义的后端进行处理。
Pilot
Pilot为Envoy提供服务发现、智能路由（如AB测试、金丝雀部署）和弹性流量管理功能（如超时、重试、熔断）。它负责将高层的抽象的路由规则转化成低级的envoy的配置。
Citadel
Citadel提供了服务间和服务到终端用户的认证，同时可以直接将http流量升级成https流量。具体的可以查看官方文档。
安装
在这里我打算使用helm进行安装。
Prerequisite
首先，你得有一个可运行的k8s集群，我是在gke上开了一个三节点的集群作为测试使用。
其次，你得需要有helm的客户端。mac用户可以通过brew来安装。
下载release
Istio提供了一个很方便的脚本来下载并解压最新版的Istio，如下：
1
$ curl -L https://git.io/getLatestIstio | sh -
等下载完之后，我们可以进入文件夹，并把bin目录加到path里面：
1
2
$ cd istio-0.8.0
$ export PATH=$PWD/bin:$PATH
使用helm进行安装
要使用helm来安装istio，首先需要在集群里面配置好helm和tiller，如下：
1
2
$ kubectl create -f install/kubernetes/helm/helm-service-account.yaml
$ helm init --service-account tiller
等helm和tiller配置完之后，就可以使用helm来一键安装Istio了：
1
$ helm install install/kubernetes/helm/istio --name istio --namespace istio-system
这样，Istio就安装好了。
为了验证安装是否成功，我们可以看一下是否部署了以下的service：
1
2
3
4
5
6
7
8
9
10
11
12
$ kubectl get svc -n istio-system
NAME                       TYPE           CLUSTER-IP      EXTERNAL-IP       PORT(S)                                                               AGE
istio-citadel              ClusterIP      10.19.247.33                8060/TCP,9093/TCP                                                     2m
istio-egressgateway        ClusterIP      10.19.244.143               80/TCP,443/TCP                                                        2m
istio-ingress              LoadBalancer   10.19.248.42    104.199.155.220   80:32000/TCP,443:30434/TCP                                            2m
istio-ingressgateway       LoadBalancer   10.19.254.155   35.229.183.83     80:31380/TCP,443:31390/TCP,31400:31400/TCP                            2m
istio-pilot                ClusterIP      10.19.252.30                15003/TCP,15005/TCP,15007/TCP,15010/TCP,15011/TCP,8080/TCP,9093/TCP   2m
istio-policy               ClusterIP      10.19.242.187               9091/TCP,15004/TCP,9093/TCP                                           2m
istio-sidecar-injector     ClusterIP      10.19.252.155               443/TCP                                                               2m
istio-statsd-prom-bridge   ClusterIP      10.19.246.99                9102/TCP,9125/UDP                                                     2m
istio-telemetry            ClusterIP      10.19.240.18                9091/TCP,15004/TCP,9093/TCP,42422/TCP                                 2m
prometheus                 ClusterIP      10.19.255.53                9090/TCP                                                              2m
并且确认以下的Pod是否在running状态：
1
2
3
4
5
6
7
8
9
10
11
12
13
$ kubectl get pods -n istio-system
NAME                                       READY     STATUS      RESTARTS   AGE
istio-citadel-7bdc7775c7-ntfkf             1/1       Running     0          3m
istio-egressgateway-795fc9b47-2hw69        1/1       Running     0          3m
istio-ingress-84659cf44c-dkgf4             1/1       Running     0          3m
istio-ingressgateway-7d89dbf85f-9kgth      1/1       Running     0          3m
istio-mixer-post-install-vg5gh             0/1       Completed   0          3m
istio-pilot-66f4dd866c-nwr2j               2/2       Running     0          3m
istio-policy-76c8896799-7l9nz              2/2       Running     0          3m
istio-sidecar-injector-645c89bc64-6rs5k    1/1       Running     0          3m
istio-statsd-prom-bridge-949999c4c-mpk6d   1/1       Running     0          3m
istio-telemetry-6554768879-vqmjd           2/2       Running     0          3m
prometheus-86cb6dd77c-vhf9s                1/1       Running     0          3m
当然，我们也可以自定义一些参数，具体的请看[官方文档]($ helm install install/kubernetes/helm/istio –name istio –namespace istio-system)。
样例应用
让我们部署我们的一个样例应用来看看Istio到底干了啥。
我们的样例应用叫做BookInfo，这个应用由四个微服务所组成，具体架构图如下：
这个应用是用不同的语言所写的，让我们来见识一下Istio的魔力吧。
安装这个应用非常简单，我们只要执行以下命令即可：
1
2
$ kubectl apply -f samples/bookinfo/kube/bookinfo.yaml
$ istioctl create -f samples/bookinfo/routing/bookinfo-gateway.yaml
我们可以注意一下，在bookinfo.yaml中的manifest如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
# Copyright 2017 Istio Authors
#
#   Licensed under the Apache License, Version 2.0 (the "License");
#   you may not use this file except in compliance with the License.
#   You may obtain a copy of the License at
#
#       http://www.apache.org/licenses/LICENSE-2.0
#
#   Unless required by applicable law or agreed to in writing, software
#   distributed under the License is distributed on an "AS IS" BASIS,
#   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
#   See the License for the specific language governing permissions and
#   limitations under the License.

##################################################################################################
# Details service
##################################################################################################
apiVersion: v1
kind: Service
metadata:
  name: details
  labels:
    app: details
spec:
  ports:
  - port: 9080
    name: http
  selector:
    app: details
---
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: details-v1
spec:
  replicas: 1
  template:
    metadata:
      labels:
        app: details
        version: v1
    spec:
      containers:
      - name: details
        image: istio/examples-bookinfo-details-v1:1.5.0
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 9080
---
...
但是我们真正部署出来后，变成了这样：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
apiVersion: v1
kind: Pod
metadata:
  annotations:
    sidecar.istio.io/status: '{"version":"55c9e544b52e1d4e45d18a58d0b34ba4b72531e45fb6d1572c77191422556ffc","initContainers":["istio-init"],"containers":["istio-proxy"],"volumes":["istio-envoy","istio-certs"],"imagePullSecrets":null}'
  creationTimestamp: 2018-07-05T09:10:55Z
  generateName: details-v1-5f94c6d66b-
  labels:
    app: details
    pod-template-hash: "1950728226"
    version: v1
  name: details-v1-5f94c6d66b-jj6lz
  namespace: default
  ownerReferences:
  - apiVersion: apps/v1
    blockOwnerDeletion: true
    controller: true
    kind: ReplicaSet
    name: details-v1-5f94c6d66b
    uid: 528aa360-8033-11e8-8cec-0e04fb7e7092
  resourceVersion: "15620"
  selfLink: /api/v1/namespaces/default/pods/details-v1-5f94c6d66b-jj6lz
  uid: 528d5618-8033-11e8-8cec-0e04fb7e7092
spec:
  containers:
  - image: istio/examples-bookinfo-details-v1:1.5.0
    imagePullPolicy: IfNotPresent
    name: details
    ports:
    - containerPort: 9080
      protocol: TCP
    resources: {}
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: default-token-f9mls
      readOnly: true
  - args:
    - proxy
    - sidecar
    - --configPath
    - /etc/istio/proxy
    - --binaryPath
    - /usr/local/bin/envoy
    - --serviceCluster
    - details
    - --drainDuration
    - 45s
    - --parentShutdownDuration
    - 1m0s
    - --discoveryAddress
    - istio-pilot.istio-system:15007
    - --discoveryRefreshDelay
    - 10s
    - --zipkinAddress
    - zipkin.istio-system:9411
    - --connectTimeout
    - 10s
    - --statsdUdpAddress
    - istio-statsd-prom-bridge.istio-system:9125
    - --proxyAdminPort
    - "15000"
    - --controlPlaneAuthPolicy
    - NONE
    env:
    - name: POD_NAME
      valueFrom:
        fieldRef:
          apiVersion: v1
          fieldPath: metadata.name
    - name: POD_NAMESPACE
      valueFrom:
        fieldRef:
          apiVersion: v1
          fieldPath: metadata.namespace
    - name: INSTANCE_IP
      valueFrom:
        fieldRef:
          apiVersion: v1
          fieldPath: status.podIP
    - name: ISTIO_META_POD_NAME
      valueFrom:
        fieldRef:
          apiVersion: v1
          fieldPath: metadata.name
    - name: ISTIO_META_INTERCEPTION_MODE
      value: REDIRECT
    image: docker.io/istio/proxyv2:0.8.0
    imagePullPolicy: IfNotPresent
    name: istio-proxy
    resources:
      requests:
        cpu: 100m
        memory: 128Mi
    securityContext:
      privileged: false
      readOnlyRootFilesystem: true
      runAsUser: 1337
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /etc/istio/proxy
      name: istio-envoy
    - mountPath: /etc/certs/
      name: istio-certs
      readOnly: true
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: default-token-f9mls
      readOnly: true
  dnsPolicy: ClusterFirst
  initContainers:
  - args:
    - -p
    - "15001"
    - -u
    - "1337"
    - -m
    - REDIRECT
    - -i
    - '*'
    - -x
    - ""
    - -b
    - 9080,
    - -d
    - ""
    image: docker.io/istio/proxy_init:0.8.0
    imagePullPolicy: IfNotPresent
    name: istio-init
    resources: {}
    securityContext:
      capabilities:
        add:
        - NET_ADMIN
      privileged: true
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: default-token-f9mls
      readOnly: true
  nodeName: ip-172-31-39-23
  restartPolicy: Always
  schedulerName: default-scheduler
  securityContext: {}
  serviceAccount: default
  serviceAccountName: default
  terminationGracePeriodSeconds: 30
  tolerations:
  - effect: NoExecute
    key: node.kubernetes.io/not-ready
    operator: Exists
    tolerationSeconds: 300
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
  volumes:
  - emptyDir:
      medium: Memory
    name: istio-envoy
  - name: istio-certs
    secret:
      defaultMode: 420
      optional: true
      secretName: istio.default
  - name: default-token-f9mls
    secret:
      defaultMode: 420
      secretName: default-token-f9mls
可以看到，本来只有一个container的，现在里面多了一个container和initContainer。这个就是Istio的Auto Injection，可以自动把sidecar注入到Pod里面，让我们不需要手动一个一个修改yaml文件，也防止手动修改过程中出错的可能。
使用实例
这里我们以路由设置为例子。
首先我们打开刚才部署好的这个应用的网页，可以看到页面右方的Book Reviews部分里面每次刷新都会随机性地出现黑星星、红星星和没有星星三种情况，这是因为我们有三个不同的backend，路由在默认情况下会随机路由到任意一个backend上。
我们先尝试把所有的路由都路由到v1版本上（就是没有星星的版本），路由规则如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: details
  ...
spec:
  hosts:
  - details
  http:
  - route:
    - destination:
        host: details
        subset: v1
---
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: productpage
  ...
命令如下：
1
$ istioctl create -f samples/bookinfo/routing/route-rule-all-v1.yaml
然后我们再去刷新，就会发现不管怎么刷新星星都不见了。
接着，假如我们有一个用户是jason，我们希望他能测试v2的backend，就可以用下面的路由规则：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
kind: VirtualService
metadata:
  name: reviews
  ...
spec:
  hosts:
  - reviews
  http:
  - match:
    - headers:
        cookie:
          regex: ^(.*?;)?(user=jason)(;.*)?$
    route:
    - destination:
        host: reviews
        subset: v2
  - route:
    - destination:
        host: reviews
        subset: v1
命令如下：
1
$ istioctl replace -f samples/bookinfo/routing/route-rule-reviews-test-v2.yaml
这时候，我们打开网页，以jason这个用户登录（密码随便填），就会发现每一次访问到的都是带有黑星星的版本。
这就是Istio提供的路由功能。
总结
本文中我们简单讲了Service Mesh的概念，如何创建Istio以及简单的使用过程，如果大家有兴趣探索Istio更多的功能，可以直接访问Istio的官网。


如何用技术变现 —— 左耳朵耗子专栏记录
2018-06-14T05:35:58.000Z
昨天购买了左耳朵耗子的付费专栏，拜读了前几篇文章，受益匪浅，故总结并写下此文作为记录。
程序员是手艺人，是靠手艺靠技术吃饭的人，那么怎么样能通过自己的手艺自己的技术赚钱呢？简单来说，就是别人不行的，你可以，这才是核心。在别的文章中也看到过类似概念，大同小异，强调的都是不可替代性。
那么问题就变成了：如何让自己的“手艺”更值钱，更无法替代？
耗子哥总结下来，一共是有以下几点：
千里之行，积于跬步。不可能一蹴而就，肯定需要脚踏实地一点一点积累才可以，厚积而薄发。需要自己比别人更多地去学习新的技术和技能，有别人没有的经验和经历。
关注有价值的东西。这一段我认为我无法总结得更好，所以直接引用原文：
什么是有价值的东西？价值其实是受供需关系影响的，供大于求，就没什么价值，供不应求，就有价值。这意味着你不仅要看到市场，还要看到技术的趋势，能够分辨出什么是主流技术，什么是过渡式的技术。当你比别人有更好的嗅觉时，你就能起动得更快，也就比别人有先发优势。
关于市场需求。要看清市场，就需要看看各个公司在做什么，他们的难题是什么。简单来说，现在的每家公司无论大小都缺人。是真的缺人吗？中国是人口大国，不缺写代码搬砖的，真正缺的是有能力能够解决技术难题的人，能够提高团队人效的人。所以，从这些方面思考，你会知道哪些技能才是真正的“供不应求”，这样可以让你更有价值。
关于技术趋势。要看清技术趋势，你需要了解历史，就像一个球运动一样，你要知道这个球未来运动的地方，是需要观察球的已经完成运动的轨迹才知道的。因此，了解技术发展轨迹是一件很重要的事。要看一个新的技术是否顺应技术发展趋势，你需要将一些老技术的本质吃得很透。
因此，在学习技术的过程一定要多问自己两个问题：“1. 这个技术解决什么问题？为什么别的同类技术做不到？2. 为什么是这样解决的？有没有更好的方式？”另外，还有一个简单的判断方法，如果一个新的技术顺应技术发展趋势，那么在这个新的技术出现时，后面一定会有大型的商业公司支持，这类公司支持得越多，就说明你越需要关注。
找到能体现价值的地方。在一家高速发展的公司中，技术人员的价值可以最大化。这就要求自己一定要能找到一个高速发展的公司以及一个高速发展的领域。
动手能力很重要。简单来说，就是要会写代码！细节是魔鬼！而不是做一个ppt架构师！
关注技术付费点。技术付费点在耗子哥的总结里面有两个地方：一个是能帮别人挣钱的地方，一个是能帮别人省钱的地方。这也是所有技术的核心竞争力。
提升自己的能力和经历。别人要付费给你，前提是信任你，所以你需要提升自己的能力和经历才可以使得别人愿意信任你付费给你。
找到有价值的信息源。这个是程序猿基本功了，不再赘述。
输出观点和价值观。同样的，需要积跬步，厚积而薄发。
朋友圈很重要。你和谁在一起，就会成为什么样的人。物以类聚，人以群分。
最后套用耗子哥的结束语吧，我也认为无法提炼地更好了：
总之，就一句话，会挣钱的人一定是会投资的人。我一直认为，最宝贵的财富并不是钱，而是你的时间，时间比钱更宝贵，因为钱你不用还在那里，而时间你不用就浪费掉了。你把你的时间投资在哪些地方，就意味着你未来会走什么样的路。所以，利用好你的时间，投到一些有意义的地方吧。
最后附上耗子哥专栏海报：



若饭液体版v3.1评测
2018-06-13T06:32:51.000Z
缘起
很久之前就看到大学室友有吃过若饭，当时还推荐给我不过我当时忙于写（撸）代（啊）码（撸）并没有理，昨天在网上又碰巧看到了若饭，于是抱着吃螃蟹的心态打算买来尝一尝。
若饭是一种代餐食品（饮料？），是为了那些忙的没时间吃饭的人所设计的，据说创始人原来也是程序猿，忙的没法吃饭，于是自己瞎鼓捣出了一些用来解决吃饭问题的混合物，自己吃下来觉得不错，于是想以此创业。
若饭目前有三个产品线，分别是：
V1.x，代餐豆
V2.x，粉末版
V3.x，液体版
昨天我买了粉末版和液体版的，付完钱已经4点了，联系客服说3点30快递走得第二天发货，但是我就说我之后不方便收快递，于是客服马上联系了仓库，仓库说已经下班了，客服说给我叫个顺丰发货，在这里赞一个 饭桶@若饭 。
发了顺丰今天早上8点多就送到了，速度飞快，一共就花了大概十几个小时从湖州发货到上海。
初见
本来以为再怎么也得等下班回家才能拿到，没想到一早上刚准备出门上班就遇上了来送若饭的快递小哥。
若饭包装如下：
粉末版的包装如下：
买了粉末版，套餐里面还送了一个搅拌杯和量勺：
对于粉末版而言，需要自己冲泡。由于时间关系，今天打算使用的是V3.1液体版：
评测
总算等到中午了，可以开始吃若饭了。今天带了一瓶液体版的来公司当做午餐。液体版的瓶口有密封措施，不过有缺口，很容易打开，设计的不错。
摇晃均匀后，打开瓶盖，颜色是咖啡色的。尝了第一口，感觉里面有点粉末状的东西没有溶解在液体中，应该是各种蛋白粉之类的物质，口感由于有粉末状的物质在里面混着，所以多多少少受了一点影响，不是我预计中的丝滑或者类似饮料的口感。味道比较淡，带有一点点的咖啡的味道，还有豆奶的味道混杂在一起，其中豆制品的味道较为明显，应该和其中有豆类成分是相关的。
虽然前几口喝下去并没有什么惊艳的感觉，味道也不是那种特别出众的味道，但是还是挺经喝的，因为在喝完几口之后品味了一下，有种欲望想要接着去再喝几口。仔细思考下来，应该是口味特意做成这样的，不容易让人腻。
人体每天需要多少营养，若饭配比如何在这里不论，官网和包装上都有很多数据，而且在没有各种仪器测量的情况之下无法得出结论；但是若饭确实能给人带来饱腹感——虽然不知道原理是什么——在喝了半瓶之后就已经觉得自己饱了，这样看来可能确实一瓶的量是能给人带来3-4小时饱腹感的，并没有夸大其词。
总结
若饭作为新型代餐类食品（饮料），抓住了人们吃饭的这个痛点问题，并且提出了一种解决方案，从方便和健康的角度尝试解决这个问题，主要的好处还是食用方便而且营养科学合理，能够节省下来吃饭的时间，比如像我现在可以写一段代码，在思考的时候喝几口若饭就能解决午餐，同时也不用去考虑吃的是否健康。如果是对口味口感上要求很高的话，也许若饭并不能在口味口感上做得很好。
接着，聊一下价格相关的事情，除了若饭的V2.x的袋装粉末版（需要自己冲泡及清洗杯子）价格还属于尚可之外，别的产品（比如瓶装粉末版，喝完直接扔瓶子）的价格对我这种工薪阶层的人来说还是偏贵一些，不过这也正常，毕竟现在越来越多的消费是拿去买了方便的体验，而并非仅仅是物质上的价值。若饭的本质其实就是医院肠胃科的肠内营养素，只不过医院不会把这种东西做得这么方便人们食用，也不会卖给健康人，而若饭做到了将科学合理配比的饮食做得非常方便去食用，从这个角度来说我认为若饭其实属于附加价值高的商品，而不是类似于大多数的别的零食饮料，是以成本为主的。
总而言之，若饭可以使得吃饭变得简单、健康、快速，但是吃久了可能会觉得口腹之欲没能满足，还是会想要吃一些好吃的口味重的东西。若饭可以在工作特别忙的时候用来应急当做快速午餐，平时不忙的时候去吃普通的饭菜，这样交替的去食用可能是更好的方案。


LintCode 415.有效回文串
2018-03-30T10:02:44.000Z
题意
给定一个字符串，判断其是否为一个回文串。只包含字母和数字，忽略大小写。
注意事项
你是否考虑过，字符串有可能是空字符串？这是面试过程中，面试官常常会问的问题。
在这个题目中，我们将空字符串判定为有效回文。
样例
"A man, a plan, a canal: Panama" 是一个回文。
"race a car" 不是一个回文。
思路
这道题的思路很简单，先把给定字符串预处理一下，先只选择其中的字母和数据，再全部变成小写（大写），然后根据回文串的性质左右两边进行比较即可。
坑点在于题意中的注意事项说的，如果是空串的情况。
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
class Solution:
    """
    @param s: A string
    @return: Whether the string is a valid palindrome
    """
    def isPalindrome(self, s):
        # edge condition
        if s == "":
            return True
        # pre-process
        real = [ch.lower() for ch in s if ch.isalnum()]
        # solve
        i = 0
        j = len(real) - 1
        while i <= j:
            if real[i] != real[j]:
                return False
            i += 1
            j -= 1
        return True



LintCode 627.最长回文串
2018-03-30T09:10:06.000Z
题意
给出一个包含大小写字母的字符串。求出由这些字母构成的最长的回文串的长度是多少。
数据是大小写敏感的，也就是说，"Aa" 并不会被认为是一个回文串。
注意事项
假设字符串的长度不会超过 1010。
样例
给出 s = "abccccdd" 返回 7
一种可以构建出来的最长回文串方案是 "dccaccd"。
思路
看到题目，第一个关键是看到，这道题只要求长度即可，不需要求出具体的回文串，所以会方便很多。
既然只要求出长度，那么一定是有一些简单的方法算出来不用求出具体的回文串到底如何的。
那我们就思考，要组成回文串需要什么样的条件呢？
单个字母，放在回文串中间，一定是回文串
两个相同的字母，一定能组成回文串
两个或者多个不同的字母，一定不能组成回文串
这里的关键是第二点，两个相同的字母一定能组成回文串，所以我们就先考虑一下，如果一个字母在给定字符串中出现了偶数次数，那么一定能组成回文串。
那如果一个字母出现了奇数次呢？
思考一下就能想到，奇数次的出现次数，等于偶数次+1。
根据上面的第一和第三点，如果说有出现奇数次的字母，那么这些字母中可以选择一个放在回文串中间，这样长度可以+1。
最后剩下的就是一些边界情况处理了，比如，如果所有的字母都出现偶数次。
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Solution:
    """
    @param s: a string which consists of lowercase or uppercase letters
    @return: the length of the longest palindromes that can be built
    """
    def longestPalindrome(self, s):
        odd = list()
        for ch in s:
            if ch not in odd:
                odd.append(ch)
            else:
                odd.remove(ch)

        num = len(odd)
        if num > 0:
            num -= 1
        return len(s) - num



如何使用Helm进行本地开发
2018-01-17T04:49:30.000Z
Helm是kubernetes的官方包管理工具。根据官网上的描述Helm is the best way to find, share, and use software built for Kubernetes.可以看出helm在kubernetes社区中的定位。
这篇文章并不是helm的入门文章，而是着重于如何在本地开发chart。希望进行helm入门的同学可以参考官方文档。
概述
本文会分为两个部分来探讨如何在本地开发chart，分别是：
Chart的规范
Helm提供的本地开发功能
Chart的规范
根据定义，一个Chart是一些有相关性的Kubernetes资源的集合。一个chart可以是一个简单的应用，比如memcached，或者是一个复杂的集合，比如一个full-stack的web的应用，含有server，ui，database，cache等等。
Chart从本质上只不过是一些文件，不过这些文件需要满足一定的规范，比如目录的规范和文件名的规范。
Chart的目录结构
根据规定，符合如下目录结构的目录就是一个Chart，目录名即为Chart名（不包含版本信息）：
1
2
3
4
5
6
7
8
9
10
wordpress/
  Chart.yaml          # A YAML file containing information about the chart
  LICENSE             # OPTIONAL: A plain text file containing the license for the chart
  README.md           # OPTIONAL: A human-readable README file
  requirements.yaml   # OPTIONAL: A YAML file listing dependencies for the chart
  values.yaml         # The default configuration values for this chart
  charts/             # OPTIONAL: A directory containing any charts upon which this chart depends.
  templates/          # OPTIONAL: A directory of templates that, when combined with values,
                      # will generate valid Kubernetes manifest files.
  templates/NOTES.txt # OPTIONAL: A plain text file containing short usage notes
虽然这里看到charts和templates文件夹都是optional的，但是至少需要有一个存在，chart才是合法的。
Chart.yaml文件
每个Chart都必须有一个Chart.yaml文件，这个文件的内容如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
name: The name of the chart (required)
version: A SemVer 2 version (required)
description: A single-sentence description of this project (optional)
keywords:
  - A list of keywords about this project (optional)
home: The URL of this project's home page (optional)
sources:
  - A list of URLs to source code for this project (optional)
maintainers: # (optional)
  - name: The maintainer's name (required for each maintainer)
    email: The maintainer's email (optional for each maintainer)
    url: A URL for the maintainer (optional for each maintainer)
engine: gotpl # The name of the template engine (optional, defaults to gotpl)
icon: A URL to an SVG or PNG image to be used as an icon (optional).
appVersion: The version of the app that this contains (optional). This needn't be SemVer.
deprecated: Whether or not this chart is deprecated (optional, boolean)
tillerVersion: The version of Tiller that this chart requires. This should be expressed as a SemVer range: ">2.0.0" (optional)
Chart的版本
每个Chart都必须有一个版本号，版本号必须遵守语义化版本规范V2。每个package（Chart打包后的东西）同时由name和version来唯一确定。
比如，一个叫做nginx的版本为1.2.3的Chart，打包后就是nginx-1.2.3.tgz。
更复杂的语义化版本号是被支持的，比如version: 1.2.3-alpha.1+ef365但是非语义化的版本是不被允许的。
Helm和Tiller都会使用Chart的名称+版本来唯一标识一个package，所以Chart.yaml里面的版本一定要对应package的文件名。
appVersion
appVersion其实并没啥用，只是指定了Chart包含的应用的版本，对helm和tiller来说并不会有啥影响，也不需要和Chart的version一致。自己随便写都可以……
Deprecating Chart
可以通过在Chart.yaml里面把deprecated设为true来标识一个Chart已经是deprecated状态。
License，ReadME和Notes
一个Chart还可以有License来标识License信息，README.md来包含一些介绍信息，以及一个templates/NOTES.txt文件来指导如何去安装或者使用。
templates/NOTES.txt文件会被当做普通的template来对待（意味着其中可以有变量），并且会在每次helm status之后和helm install之后被打印到STDOUT。
比如stable/mysql的NOTES.txt如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
MySQL can be accessed via port 3306 on the following DNS name from within your cluster:
{{ template "mysql.fullname" . }}.{{ .Release.Namespace }}.svc.cluster.local

To get your root password run:

    MYSQL_ROOT_PASSWORD=$(kubectl get secret --namespace {{ .Release.Namespace }} {{ template "mysql.fullname" . }} -o jsonpath="{.data.mysql-root-password}" | base64 --decode; echo)

To connect to your database:

1. Run an Ubuntu pod that you can use as a client:

    kubectl run -i --tty ubuntu --image=ubuntu:16.04 --restart=Never -- bash -il

2. Install the mysql client:

    $ apt-get update && apt-get install mysql-client -y

3. Connect using the mysql cli, then provide your password:
    $ mysql -h {{ template "mysql.fullname" . }} -p

To connect to your database directly from outside the K8s cluster:
    {{- if contains "NodePort" .Values.service.type }}
    MYSQL_HOST=$(kubectl get nodes --namespace {{ .Release.Namespace }} -o jsonpath='{.items[0].status.addresses[0].address}')
    MYSQL_PORT=$(kubectl get svc --namespace {{ .Release.Namespace }} {{ template "mysql.fullname" . }} -o jsonpath='{.spec.ports[0].nodePort}')

    {{- else if contains "ClusterIP" .Values.service.type }}
    MYSQL_HOST=127.0.0.1
    MYSQL_PORT={{ default "3306" .Values.service.port }}

    # Execute the following commands to route the connection:
    export POD_NAME=$(kubectl get pods --namespace {{ .Release.Namespace }} -l "app={{ template "mysql.fullname" . }}" -o jsonpath="{.items[0].metadata.name}")
    kubectl port-forward $POD_NAME {{ default "3306" .Values.service.port }}:{{ default "3306" .Values.service.port }}

    {{- end }}

    mysql -h ${MYSQL_HOST} -P${MYSQL_PORT} -u root -p${MYSQL_ROOT_PASSWORD}
可以看出来，NOTES.txt是用来给用户作使用上的指导的。
Chart的依赖
我们都知道，软件开发过程中，复用是一个很重要的概念，同样的，Chart也可以依赖于其它的Chart，可以复用其它的Chart的内容。
使用requirements.yaml
Helm提供了两种对Chart复用的方法，第一种是在requirements.yaml中指定依赖的Chart，如下：
1
2
3
4
5
6
7
dependencies:
  - name: apache
    version: 1.2.3
    repository: http://example.com/charts
  - name: mysql
    version: 3.2.1
    repository: http://another.example.com/charts
如果说需要对一个chart复用多次，可以这么干：
1
2
3
4
5
6
7
8
9
10
11
12
13
# parentchart/requirements.yaml
dependencies:
  - name: subchart
    repository: http://localhost:10191
    version: 0.1.0
    alias: new-subchart-1
  - name: subchart
    repository: http://localhost:10191
    version: 0.1.0
    alias: new-subchart-2
  - name: subchart
    repository: http://localhost:10191
    version: 0.1.0
除此之外，Helm还可以选择性的去使用依赖的chart，具体可以参考tags and condition。
直接使用charts来手动管理
第二种是直接把需要用的Chart放到charts文件夹下。一般情况下推荐使用第一种，第二种是在需要对依赖的chart做魔改的情况下用到的。
Helm还提供了helm dep这个命令来方便对依赖的管理，之后会介绍到。
依赖的一些实现细节
在helm install和helm upgrade的时候，helm会把依赖和当前chart打包成一个集合一起送给tiller，然后（目前是）按照类型+字母顺序来apply，并不是先去install依赖再去install当前的chart。
例如，我们有一个chart，会有以下三个东西：
namespace “A-Namespace”
statefulset “A-StatefulSet”
service “A-Service”
这个chart依赖于另一个chart，有如下三个东西：
namespace “B-Namespace”
replicaset “B-ReplicaSet”
service “B-Service”
那么在安装或者升级的过程中，顺序如下：
A-Namespace
B-Namespace
A-StatefulSet
B-ReplicaSet
A-Service
B-Service
Helm客户端提供的和本地开发相关的功能
Helm的客户端提供了一些和本地开发相关的命令，这里简单介绍一下。
helm completion
顾名思义，提供了命令补全，使用方式也比较简单：
1
$ source <(helm completion zsh)
helm create
可以通过这个命令直接创建出一个符合Chart规范的目录出来，比如：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$ helm create myweb
$ tree myweb
myweb
├── Chart.yaml
├── charts
├── templates
│   ├── NOTES.txt
│   ├── _helpers.tpl
│   ├── deployment.yaml
│   ├── ingress.yaml
│   └── service.yaml
└── values.yaml

2 directories, 7 files
helm dependency
顾名思义，是用来进行依赖管理的，可以被简写为helm dep，具体使用如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
$ helm dep
Manage the dependencies of a chart.

Helm charts store their dependencies in 'charts/'. For chart developers, it is
often easier to manage a single dependency file ('requirements.yaml')
which declares all dependencies.

The dependency commands operate on that file, making it easy to synchronize
between the desired dependencies and the actual dependencies stored in the
'charts/' directory.

A 'requirements.yaml' file is a YAML file in which developers can declare chart
dependencies, along with the location of the chart and the desired version.
For example, this requirements file declares two dependencies:

    # requirements.yaml
    dependencies:
    - name: nginx
      version: "1.2.3"
      repository: "https://example.com/charts"
    - name: memcached
      version: "3.2.1"
      repository: "https://another.example.com/charts"

The 'name' should be the name of a chart, where that name must match the name
in that chart's 'Chart.yaml' file.

The 'version' field should contain a semantic version or version range.

The 'repository' URL should point to a Chart Repository. Helm expects that by
appending '/index.yaml' to the URL, it should be able to retrieve the chart
repository's index. Note: 'repository' can be an alias. The alias must start
with 'alias:' or '@'.

Starting from 2.2.0, repository can be defined as the path to the directory of
the dependency charts stored locally. The path should start with a prefix of
"file://". For example,

    # requirements.yaml
    dependencies:
    - name: nginx
      version: "1.2.3"
      repository: "file://../dependency_chart/nginx"

If the dependency chart is retrieved locally, it is not required to have the
repository added to helm by "helm add repo". Version matching is also supported
for this case.

Usage:
  helm dependency [command]

Aliases:
  dependency, dep, dependencies


Available Commands:
  build       rebuild the charts/ directory based on the requirements.lock file
  list        list the dependencies for the given chart
  update      update charts/ based on the contents of requirements.yaml

Flags:
  -h, --help   help for dependency

Use "helm dependency [command] --help" for more information about a command.
helm fetch
一看这就是个下载别的chart的命令，为啥我要说和本地开发有关系呢？
因为我认为，helm的官方repo里面的chart最大的作用就是作为一个best practice来展示给使用者一个示例。
所以，当不知道该怎么写的时候，去抄吧😁。
helm lint
顾名思义，用来检查一个Chart是否存在问题。
如果说有错误，会报出error，并返回非零值。
我们就用刚才的myweb来试手：
1
2
3
4
5
$ helm lint myweb
==> Linting myweb
[INFO] Chart.yaml: icon is recommended

1 chart(s) linted, no failures
helm package
这个命令是当一个chart写完后用来把一个chart打包成chartName-version.tgz的。一般只有在发布的时候使用，提供了比较多的功能，比如sign之类的，如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
$ helm package --help
This command packages a chart into a versioned chart archive file. If a path
is given, this will look at that path for a chart (which must contain a
Chart.yaml file) and then package that directory.

If no path is given, this will look in the present working directory for a
Chart.yaml file, and (if found) build the current directory into a chart.

Versioned chart archives are used by Helm package repositories.

Usage:
  helm package [flags] [CHART_PATH] [...]

Flags:
  -u, --dependency-update    update dependencies from "requirements.yaml" to dir "charts/" before packaging
  -d, --destination string   location to write the chart. (default ".")
      --key string           name of the key to use when signing. Used if --sign is true
      --keyring string       location of a public keyring (default "/Users/daniel/.gnupg/pubring.gpg")
      --save                 save packaged chart to local chart repository (default true)
      --sign                 use a PGP private key to sign this package
      --version string       set the version on the chart to this semver version
我们还是用刚才的myweb作为例子：
1
2
$ helm package myweb
Successfully packaged chart and saved it to: /Users/daniel/Works/k8s/helm/myweb-0.1.0.tgz
helm serve
这个命令是用来在本地开启一个repo server的，可以用来本地测试使用。
helm template
这个命令可以在本地渲染出template来检查是否正确，具体使用如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
$ helm template --help
Render chart templates locally and display the output.

This does not require Tiller. However, any values that would normally be
looked up or retrieved in-cluster will be faked locally. Additionally, none
of the server-side testing of chart validity (e.g. whether an API is supported)
is done.

To render just one template in a chart, use '-x':

$ helm template mychart -x templates/deployment.yaml

Usage:
  helm template [flags] CHART

Flags:
  -x, --execute stringArray    only execute the given templates
      --kube-version string    override the Kubernetes version used as Capabilities.KubeVersion.Major/Minor (e.g. 1.7)
  -n, --name string            release name (default "RELEASE-NAME")
      --name-template string   specify template used to name the release
      --namespace string       namespace to install the release into
      --notes                  show the computed NOTES.txt file as well
      --set stringArray        set values on the command line (can specify multiple or separate values with commas: key1=val1,key2=val2)
  -f, --values valueFiles      specify values in a YAML file (can specify multiple) (default [])
我们仍然以myweb作为例子：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
$ helm template myweb
---
# Source: myweb/templates/service.yaml
apiVersion: v1
kind: Service
metadata:
  name: RELEASE-NAME-myweb
  labels:
    app: myweb
    chart: myweb-0.1.0
    release: RELEASE-NAME
    heritage: Tiller
spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 80
      protocol: TCP
      name: nginx
  selector:
    app: myweb
    release: RELEASE-NAME

---
# Source: myweb/templates/deployment.yaml
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: RELEASE-NAME-myweb
  labels:
    app: myweb
    chart: myweb-0.1.0
    release: RELEASE-NAME
    heritage: Tiller
spec:
  replicas: 1
  template:
    metadata:
      labels:
        app: myweb
        release: RELEASE-NAME
    spec:
      containers:
        - name: myweb
          image: "nginx:stable"
          imagePullPolicy: IfNotPresent
          ports:
            - containerPort: 80
          livenessProbe:
            httpGet:
              path: /
              port: 80
          readinessProbe:
            httpGet:
              path: /
              port: 80
          resources:
            {}


---
# Source: myweb/templates/ingress.yaml
helm verify
这个命令是用来验证一个给定的chart是否被sign。在对安全性要求高的环境下有用。
helm plugin
最后是这个helm plugin，看到这个我们就能感觉到，helm瞬间有了无数的扩展性，需要什么功能如果helm不提供咱们就自己干一个加上去。
helm目前现在已经有了一些比较好的plugin，比如有一个plugin支持用template render出来之后再进行验证查错之类的。
如果有一些别的定制化的需求也可以通过自己写个plugin来完成。


Helm中如何传递value
2018-01-17T03:25:15.000Z
Helm是kubernetes的官方包管理工具。根据官网上的描述Helm is the best way to find, share, and use software built for Kubernetes.可以看出helm在kubernetes社区中的定位。
这篇文章并不是helm的入门文章，而是着重于helm中的chart之间如何传递value。希望进行helm入门的同学可以参考官方文档。
概述
在helm的使用过程中，经常会出现两种需求：
在父chart中读取子chart的某些value的值
在父chart中修改子chart的某些value的值
helm对于这两种场景提供了比较完备的支持，下面我们来具体讲一下解决方案。
在父chart中读取子chart的值
helm提供了两种方法来应对这种情况：
使用export格式
如果说一个child的chart在values的root下有一个叫做export的key，那么它的parent chart就可以直接在requirements里面通过指定需要import的key来将值import到自身的values里面，例子如下：
1
2
3
4
# parent's requirements.yaml file
    ...
    import-values:
      - data
1
2
3
4
5
# child's values.yaml file
...
exports:
  data:
    myint: 99
helm会发现，我们指定了要import data这个key，所以就去child的values.yaml里面寻找，发现了这个key有被export，于是就import了它的内容。
这时候的parent的values如下：
1
2
3
# parent's values file
...
myint: 99
需要注意，在parent的values中data这个key不会被import进来，只会import data的内容。如果希望把这个key也一起import进来，可以使用下面说的方法。
使用child/parent格式
如果我们想要获得一些不在exports这个key下面的值，我们就必须指定在child中要import的路径，以及在parent中的对应路径，如下：
1
2
3
4
5
6
7
8
9
# parent's requirements.yaml file
dependencies:
  - name: subchart1
    repository: http://localhost:10191
    version: 0.1.0
    ...
    import-values:
      - child: default.data
        parent: myimports
根据如上的这个requirements文件，helm将会在child的chart中寻找default.data的值，并导入到parent中的myimports这个路径下。
假设parent和child初始的values如下：
1
2
3
4
5
6
# parent's values.yaml file

myimports:
  myint: 0
  mybool: false
  mystring: "helm rocks!"
1
2
3
4
5
6
# subchart1's values.yaml file

default:
  data:
    myint: 999
    mybool: true
那么导入之后，真正渲染出来的parent的values的值为：
1
2
3
4
5
6
# parent's final values

myimports:
  myint: 999
  mybool: true
  mystring: "helm rocks!"
可以看出来，parent中的values把myint和mybool从subchart1里面import了进来。
在父chart中修改子chart的值
想要再父chart中修改子chart的值比较容易，假设子chart的名字是mychartabc，那么我们可以很简单地在父chart的values中通过以下方式进行修改：
1
2
3
4
5
# in parent's values.yaml
...

mychartabc:
  key: value
这样就可以修改子chart的值了。
出处
https://docs.helm.sh/developing_charts/#importing-child-values-via-requirements-yaml
https://docs.helm.sh/chart_template_guide/#overriding-values-from-a-parent-chart


Kubernetes中的Network
2018-01-08T08:01:50.000Z
Kubernetes 处理网络的方式和Docker不同，主要需要解决四种问题：
高度耦合的Container之间的网络通信：这个由Pod和localhost通信解决了；
Pod和Pod之间的网络通信，这个是本篇的主要内容；
Pod和Service之间的通信，这个是由Service解决的；
外部Service和内部Service之间的通信，这个也是由Service解决的。
简介
Kubernetes 假设 Pod 之间可以互相通信，无论它们在哪个主机上。我们给每个Pod一个单独的IP地址，那么我们就不用专门在Pod之间创建链接，或者映射container的port到主机的port来使得外部可以访问到container了。这使得我们创建了一个非常干净，向后兼容的模型，在这个模型里面Pod可以就被当做为一个VM或者甚至一个物理机，这给了我们很多方面的方便，比如port的分配，命名，服务注册、发现，负载均衡，应用程序设置和迁移等。
为了达成这个目标，我们必须规定如何设置集群的网络。
Docker的模型
在讨论Kubernetes处理网络的方法之前，我们需要先复习一下Docker是如何处理网络的。在默认情况下，Docker用的是主机私有的网络，默认情况下会创建一个叫做docker0的虚拟网桥，并且分配一段子网给它。对于每个Docker创建的container，都会分配一个虚拟的附加于这个网桥的网络设备（被称为veth），这个veth其实是通过linux的namespace来映射到container里面的eth0的。这个容器里的eth0会被分配一个虚拟网桥的网段里面的IP地址。
结果就是，Docker的容器只能和在同一个机器（也就是在同一个网桥）里面的容器交流，不能和外部别的机器上的容器之间建立连接。事实上，不同机器上的容器，可能会有同样的网段和IP地址。
如果说要让Docker容器能跨Node交流，那么必须给他们分配主机上的port，并通过这个port和主机IP来唯一确定一个容器的地址，然后主机会把请求转发给container。这显然会带来很多的问题。
Kubernetes的模型
在大量的开发者之间协调port的使用很明显是非常难以扩展和管理的。动态分配port又会给系统带来很大的复杂性——每一个应用程序都必须把port作为一个flag，API Server必须知道如何去把动态的port插入到配置块里面，Service必须知道如何去找到彼此，等等。与其解决这么多的问题，不如咱们自己干，重头设计。
Kubernetes规定了如下的网络实现规范（除非有意不这么做）：
所有的container都可以在不使用NAT的情况下访问到任何别的container
所有的node都可以在不使用NAT的情况下访问到任何别的container（反之亦然）
每个container自己看到的自己的IP地址，和被人看到的是一样的
这些要求其实就是说，你不能直接在两台机器上装上Docker，然后指望Kubernetes会工作，你必须保证这些基础要求被满足。
这个模型不止简单了很多，而且还吻合了Kubernetes对于把app从vm迁移到container的方便性要求。意思是，如果你之前的app是运行在vm里面的，那么vm和vm之间能通过IP地址互相通信是一个基本的要求。反之，放到container里面也是这样。
不过事实上，Kubernetes中并不是每一个container都会有自己的IP地址，其实Kubernetes是以Pod作为最小的分配IP地址的单位的——Pod中的container会共享同一个IP地址——也就是共享同一个network namespace。这使得所有的同一个Pod里面的container都能通过localhost直接访问到彼此。不过这个带来的问题是每个Pod里面的container需要协调好port的使用，防止冲突，但是这个和在VM里面是相同的，所以并不是什么太大的问题。我们称之为“IP-per-pod”模型。
在Docker里面，请求一个host port是可行的，但是这个模型使得操作更加简单。我们会在每个host Node上分配一个port，并把所有的traffic都转发给Pod。Pod本身并不需要知道这些，只当自己是一个vm或者甚至物理机就好了。
如何实现
目前有很多方法能实现这个网络模型，比如说如下的这些方案：
Cilium
Cilium是一个开源的网络模型，实现了L3-L7层的安全策略，具体的可以看一下文档。
Contiv
Contiv提供了可设置的网络模型。
Flannel
Flannel是一个非常简单的网络层，不过很多人都说好用。
总结
实现的方案非常多，我就不一一列举了，大家可以直接去参考官方文档中的内容。
网络是个很复杂的东西，很多时候问题都会出在网络上，不同的业务模型需要使用不同的网络插件，没有万金油的解决方案。


kubernetes 中的 ingress
2017-12-28T08:56:45.000Z
在我之前的kubernetes中的Service中，我们可以看到如何使用Service来让我们的应用可以被集群外所访问到。但是在实际使用中，仍然存在一些问题。对于我们经常用的NodePort和LoadBalancer这两个type，LoadBalancer需要底层的infra支持，并且哪怕支持了我们也不能轻易用，因为LoadBalancer资源是有限的，而且最重要的是贵，贵，贵。而对于NodePort来说，我们需要经常更新我们的proxy设置，并且追踪哪些Port被使用了，所以也是很麻烦的。
万能的程序猿总是有解决方案，ingress应运而生。
Ingress
通过使用Service，路由的规则是直接附属到一个特定的Service上，并且生命周期和Service一样。如果说，我们能把路由规则和应用解耦，那么我们就可以随意的去更新应用而不影响访问，或者随意的去更改路由规则了。Ingress正是做这个的。
根据Kubernetes官方文档：
An Ingress is a collection of rules that allow inbound connections to reach the cluster Services.
Ingress实际上做了一个Layer 7的HTTP load balancer，并且提供了以下功能：
TLS(Transport Layer Security)
Name-based virtual hosting
Path-based routing
Custom rules
通过Ingress，用户不需要直接连接到Service，用户可以直接访问到ingress的endpoint，然后通过Ingress再转发到Service。样例Ingress配置如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: web-ingress
spec:
  rules:
  - host: blue.myweb.com
    http:
      paths:
      - backend: 
          serviceName: blue-service
          servicePort: 80
  - host: green.myweb.com
    http:
      paths:
      - backend:
          serviceName: green-service
          servicePort: 80
根据这个配置，用户访问blue.myweb.com和green.myweb.com将会访问到同一个ingress的endpoint，并且再被转发到blue-service和green-service中。这个就是之前说的Name-based virtual hosting。
我们也可以用Fan Out Ingress rules，比如我们访问myweb.com/blue和myweb.com/green，然后这些也会被转发到blue-service和green-service：
Ingress这个Resource其实并不做转发，而是由Ingress Controller来做的。
Ingress Controller
Ingress Controller其实就是一个监听master node上API Server对Ingress Resource的改变然后改变这个Layer 7 Load Balancer的Controller。Kubernetes有好多种不同的Ingress Controllers，比如说GCE L7 Load Balancer和Nginx Ingress Controller。当然，如果我们需要的话也可以写一个自己的。
需要保证Ingress Controller被启用，Ingress才可以使用。
创建一个Ingress Resource
我们可以通过kubectl create来创建一个ingress资源，比如假设我们有一个叫做myweb-ingress.yaml的文件，内容如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: web-ingress
spec:
  rules:
  - host: blue.myweb.com
    http:
      paths:
      - backend: 
          serviceName: blue-service
          servicePort: 80
  - host: green.myweb.com
    http:
      paths:
      - backend:
          serviceName: green-service
          servicePort: 80
我们可以通过：
1
$ kubectl create -f myweb-ingress.yaml
来创建这个ingress的资源。然后只要修改我们的域名dns，指向ingress的endpoint即可（在本机上可以通过修改/etc/hosts来达成目的）。


kubernetes 中的 ConfigMap 和 Secret
2017-12-28T07:50:20.000Z
为什么要有这俩玩意儿？
我们在kubernetes上部署应用的时候，经常会需要传一些配置给我们的应用，比如数据库地址啊，用户名密码啊之类的。我们要做到这个，有好多种方案，比如：
我们可以直接在打包镜像的时候写在应用配置文件里面，但是这种方式的坏处显而易见而且非常明显。
我们可以在配置文件里面通过env环境变量传入，但是这样的话我们要修改env就必须去修改yaml文件，而且需要重启所有的container才行。
我们可以在应用启动的时候去数据库或者某个特定的地方拿，没问题！但是第一，实现起来麻烦；第二，如果配置的地方变了怎么办？
当然还有别的方案，但是各种方案都有各自的问题。
而且，还有一个问题就是，如果说我的一个配置，是要多个应用一起使用的，以上除了第三种方案，都没办法进行配置的共享，就是说我如果要改配置的话，那得一个一个手动改。假如我们有100个应用，就得改100份配置，以此类推……
kubernetes对这个问题提供了一个很好的解决方案，就是用ConfigMap和Secret。
创建ConfigMap
ConfigMap让我们能够从容器镜像中把配置的详细信息给解耦出来。通过ConfigMap我们能够把配置以key-value对的形式传递到container或者别的系统组件（比如Controller）里面。我们可以通过两种方式来创建ConfigMap：
From Literal Values
我们可以用kubectl create来创建一个ConfigMap，然后通过kubectl get来获取：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# Create the ConfigMap
$ kubectl create configmap my-config --from-literal=key1=value1 --from-literal=key2=value2
configmap "my-config" created 

# Get the ConfigMap Details for my-config
$ kubectl get configmaps my-config -o yaml
apiVersion: v1
data:
  key1: value1
  key2: value2
kind: ConfigMap
metadata:
  creationTimestamp: 2017-05-31T07:21:55Z
  name: my-config
  namespace: default
  resourceVersion: "241345"
  selfLink: /api/v1/namespaces/default/configmaps/my-config
  uid: d35f0a3d-45d1-11e7-9e62-080027a46057
-o yaml的作用是通过yaml的形式来返回我们所要求的配置信息。
From Configuration File
除了上面的方式，我们还可以直接通过配置文件来创建（好吧，虽然我感觉是同一种，只不过是放到文件里面了而已……），首先，我们得有一个配置文件，假设名字叫做myconfigmap.yaml：
1
2
3
4
5
6
7
8
apiVersion: v1
kind: ConfigMap
metadata:
  name: customer1
data:
  TEXT1: Customer1_Company
  TEXT2: Welcomes You
  COMPANY: Customer1 Company Technology Pct. Ltd.
然后，我们可以通过kubectl create -f来创建：
1
2
$ kubectl create -f myconfigmap.yaml
configmap "customer1" created
使用ConfigMap
我们可以有两种方法来使用ConfigMap：
通过env
我们可以设置env从ConfigMap读取：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
....
 containers:
      - name: rsvp-app
        image: teamcloudyuga/rsvpapp
        env:
        - name: MONGODB_HOST
          value: mongodb
        - name: TEXT1
          valueFrom:
            configMapKeyRef:
              name: customer1
              key: TEXT1
        - name: TEXT2
          valueFrom:
            configMapKeyRef:
              name: customer1
              key: TEXT2
        - name: COMPANY
          valueFrom:
            configMapKeyRef:
              name: customer1
              key: COMPANY

....
这样，我们的container就可以读取到ConfigMap里面存储的信息了。
不过一般情况下，我个人推荐使用另一种方式：
通过Volume
这种方式我比较推荐，因为随着ConfigMap被修改（比如你想要更新一些设置），container里面对应的文件内容也会被修改，这样可以不用重启Container就让应用能够得到最新的配置信息。
这个内容需要一些Volume相关的知识，在此不做更多讲解，大家可以去参考官方文档。
创建Secret
通过上面的部分，我们可以看到ConfigMap是用来做一些配置信息的，那么如果我们有一些机密信息比如说密钥、密码之类的信息，应该存在哪里呢？看到这个名字大家应该就明白了吧，kubernetes提供了Secret来存储相关的信息。
具体为什么要存在Secret里面，Secret和ConfigMap有什么区别，后面会讲到。
创建Secret
我们可以通过kubectl create secret来通过一个文件创建一个secret，如下：
1
2
3
4
5
6
7
8
9
10
# Create a file with password
$ echo 'mysqlpassword' > password.txt

# Make sure there is no trailing newline in the file, after our password. 
# To remove any newline, we can use the tr command:
$ tr -Ccsu '\n' < password.txt > .strippedpassword.txt && mv .strippedpassword.txt password.txt

# Create the Secret 
$ kubectl create secret generic my-password --from-file=password.txt
secret "my-password" created
我们也可以手动创建一个Secret，不过要注意，所有的secret的data都要以base64进行加密：
1
2
3
4
5
6
7
8
9
10
11
12
$ cat password.txt | base64
bXlzcWxwYXN3b3JkCg==

# and then use it in the configuration file:

apiVersion: v1
kind: Secret
metadata:
  name: my-password
type: Opaque
data:
  password: bXlzcWxwYXN3b3JkCg==
使用Secret
获取Secret
我们可以通过get和describe来获取Secret，不过我们发现，kubectl并没有向我们返回Secret具体的内容：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
$ kubectl get secret my-password
NAME          TYPE     DATA   AGE 
my-password   Opaque   1      8m

$ kubectl describe secret my-password
Name:          my-password
Namespace:     default
Labels:        
Annotations:   

Type  Opaque

Data
====
password.txt:  13 bytes
在Pod里面使用
和ConfigMap一样，我们可以通过设置成env或者挂载成volume来使容器可以使用我们的secret。
具体格式如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
.....
         spec:
      containers:
      - image: wordpress:4.7.3-apache
        name: wordpress
        env:
        - name: WORDPRESS_DB_HOST
          value: wordpress-mysql
        - name: WORDPRESS_DB_PASSWORD
          valueFrom:
            secretKeyRef:
              name: my-password
              key: password.txt
.....
关于如何在Volume中使用的还是需要自行查询文档学习。
扯淡的Secret
好了，总算正文部分完了，可以讲讲Secret和ConfigMap的关系了，以及讲讲Secret到底有多扯淡……
其实目前Secret的实现，就是ConfigMap把value用base64 encode了一下……
所以，其实不存在任何安全性……
只要decode一下就能出现原来结果，相当于明文存储……
base64这玩意儿都不能叫做加密，只能叫做编码……
所以我们都不说encrypt，而是encode和decode……
当然，k8s社区有在计划对Secret进行下一步的安全性增强，当然这是后话了……
反正目前为止，Secret基本和ConfigMap一样是明文存储……
知道有多扯淡了吧……


kubernetes中的Volume
2017-12-25T03:04:48.000Z
我们都知道，容器是一个短暂的不稳定的存在（随时可能挂掉），挂掉之后里面的所有数据都没了，但是我们会有很多数据是需要一直存下来（持久化）的，那怎么办呢？思路很简单，把容器里面的数据存到一个可以持久化的地方（比如s3上）。
Volume
为了解决上面这个问题，kubernetes提供了Volume。一个Volume其实就是由一个存储中间件锁支持的一个directory，具体是什么存储中间件是由Volume的类型确定的。
如上图，在k8s里面，一个Volume会attach到一个Pod上，我们之前也有说过在Pod里面网络和存储是共享的，所以这个Volume可以被Pod中所有的container所共享。一个Volume和Pod的生命周期是一样的，不过却比containers要更长，这样可以使得数据可以在容器之间共享。
Volume Types
一个mount到Pod里面的directory是由底层的Volume Type支持的，Volume Type决定了这个directory的属性，比如大小，内容等等。下面列举一部分的Volume Type：
emptyDir
顾名思义，这就是一个“空的”Volume。这个空的Volume会在Pod被调度到node上的时候被创建。这种类型的Volume的生命周期和Pod一样，如果Pod挂了，那么这种Volume里面的所有数据也就没了。
hostPath
同样顾名思义，这就是把主机上的某个path映射到pod里面，如果Pod挂了，数据还在host上，不过如果host挂了，数据也就没了。
gcePersistentDisk
顾名思义，强耦合gce，不多说了。
awsElasticBlockStore
同上
nfs
通过nfs，我们可以mount一个nfs share到pod里。
iscsi
同上
secret
我们可以用这个type来把我们放在secret里面的那些比如密码呀token呀之类的信息挂载到pod上，让应用可以使用。
persistentVolumeClaim
这个是最重要的一种，也是最常用的一种，我们可以把一个Persistent Volume(PV)挂载到Pod里面，通过persistentVolumeClaim(PVC)。
Persistent Volumes
在传统的IT环境中，一般存储是由系统管理员来管理的，终端用户只是获得如何去使用的指导，但是不用管底层到底存储是怎么管理的。
在容器世界里面，也是一样的。Kubernetes有一个叫做Persistent Volumes的子系统，管理员通过Persistent Volume API向其中添加和管理Persistent Volume，然后用户使用Persistent Volume Claim API来使用。
一个PV就是一个通过网络挂载到集群上的存储。
PV可以通过StorageClass这个resource被静态地创建，也可以动态地被添加。一个StorageClass包含了预定义好的创建PV的初始化器和参数。
一些支持使用PV进行管理的Volume Types是：
GCEPersistentDisk
AWSElasticBlockStore
AzureFile
NFS
iSCSI
CephFS
Cinder
etc.
Persistent Volume Claims
一个Persistent Volume Claim(PVC)就是一个用户想要使用storage的请求。用户通过指定比如大小、访问权限等来申请PV资源，当有一个合适的资源(PV)被找到的时候，就会和PVC绑定在一起：
当bind成功之后，这个PVC就可以在Pod里面使用了：
当一个用户结束使用之后，绑定的PV就可以被归还(release)了，就可以重新被申明(reclaimed)和使用了。


kubernetes中的Service
2017-12-22T16:52:22.000Z
Service 是kubernetes中一个很重要的，也是很有用的概念，我们可以通过service来将pod进行分组，并提供外网的访问endpoint。在这个过程中还有比如kube-proxy提供了对service的访问。
Connecting Users to Pods
如果我们要让一个用户能够使用应用程序，用户需要能访问到pod，但是pod是一个短暂存在的东西，很可能突然挂了然后重启，这时候ip地址就会改变，所以pod的ip地址并不是静态的。比如说：
用户在这张图里面通过ip地址访问到了4个pod，突然其中有一个pod挂了，然后controller又起了一个pod：
这时候用户就访问不到了，因为用户不知道新的ip地址是多少。
kubernetes为了解决这个问题，提供了一个高层的抽象，叫做Service。Service从逻辑上把pod进行分组，并且设置访问的策略。一般我们是通过label和selector来达到分组的目的的。
Services
比如，我们用app作为key，db和frontend作为value来区分pod：
通过selector（app=frontend和app=db），我们就可以把这些pod分为两个逻辑组了。
这个时候，我们再给这两个逻辑组加上一个名称，比如frontend-svc和db-svc，就是service了：
Service对象模型
一个service对象模型大致如下：
1
2
3
4
5
6
7
8
9
10
11
kind: Service
apiVersion: v1
metadata:
  name: frontend-svc
spec:
  selector:
    app: frontend
  ports:
    - protocol: TCP
      port: 80
      targetPort: 5000
在这个对象模型中，我们创建了一个叫做frontend-svc的Service，这个service选择了所有的app=frontend的pod。在默认情况下，每个service都会有一个cluster内部可以访问到的ip地址，也被称为ClusterIP：
用户现在可以通过service的ip地址来访问到pod了，service会负责做负载均衡。
当转发请求的时候，我们可以选择pod上的目标端口，比如在我们的例子里面，frontend-svc通过80端口来接受用户的请求，然后转发到pod的5000端口。如果目标端口没有被显式声明，那么会默认转发到service接受请求的端口（和service端口一样）。
一个pod、ip地址和目标端口的元组代表了一个service的endpoint，比如在这个例子里面，frontend-svc有3个endpoints，分别是10.0.1.3:5000, 10.0.1.4:5000和10.0.1.5:5000。
kube-proxy
所有的worker node都有一个后台任务，叫做kube-proxy。这个kube-proxy会检测API Server上对于service和endpoint的新增或者移除。对于每个新的service，在每个node上，kube-proxy都会设置相应的iptables的规则来记录应该转发的地址。当一个service被删除的时候，kube-proxy会在所有的pod上移除这些iptables的规则。
服务发现
我们已经知道，Service是和kubernetes进行沟通的主要方式，那么我们就需要有一个办法来在运行的时候能够对已有的服务进行发现。Kubernetes提供了两种方法：
环境变量
每个pod在worker node上启动的时候，kubelet都会通过环境变量把所有目前可用的service的信息传进去。举个例子，我们有一个叫做redis-master的service，这个service expose了6379的端口，并且ClusterIP是172.17.0.6，那么在一个新创建的pod上，我们可以看到以下环境变量：
1
2
3
4
5
6
7
REDIS_MASTER_SERVICE_HOST=172.17.0.6
REDIS_MASTER_SERVICE_PORT=6379
REDIS_MASTER_PORT=tcp://172.17.0.6:6379
REDIS_MASTER_PORT_6379_TCP=tcp://172.17.0.6:6379
REDIS_MASTER_PORT_6379_TCP_PROTO=tcp
REDIS_MASTER_PORT_6379_TCP_PORT=6379
REDIS_MASTER_PORT_6379_TCP_ADDR=172.17.0.6
如果使用这个解决方案，我们必须非常小心启动服务的顺序，因为pod不会获得自己启动之后的service的env。
DNS
kubernetes有一些dns的addon，这些addon会自动为所有service创建一个类似my-svc.my-namespace.svc.cluster.local的dns解析，并且在同一个namespace里面的service可以直接用service name进行访问。这是最为推荐的方法。
Service类型
当我们定义一个service的时候，我们可以选择可访问的范围，比如：
是否只能在cluster内部访问
是否同时可以被cluster内部和外部访问
是否是映射到一个集群外的entity上
可访问的范围由service的类型决定，service的类型可以在创建service的时候声明。
ClusterIP 和 NodePort
ClusterIP是默认的service type，一个service通过ClusterIP来获取自己的Virtual IP，这个IP是用来和别的service通信的，只能在集群内部被访问。
NodePort的service type除了会创建一个ClusterIP之外，还会把所有worker node上的一个30000-32767之间的端口映射到这个service，比如假设32233端口映射到了frontend-svc，那么不管我们连接到哪个worker node，我们都会被转发到service分配的ClusterIP——172.17.0.4。
默认情况下，当expose到有一个nodeport的时候，kubernetes master会自动随机选择一个30000-32767之间的port，当然，我们自己也可以手动指定这个port。
NodePort的这个service type在我们想要让外网访问我们服务的时候非常有用，用户通过访问node上指定的port就可以访问到这个service。管理员可以在kubernetes集群外再搭一个反向代理就可以更方便地进行访问了。
LoadBalancer
对于LoadBalancer这个Servicetype：
NodePort和ClusterIP会被自动创建，外部的load balancer会自动路由上去
service会在一个静态的端口上被暴露
通过底层的cloud provider提供的load balancer来暴露到外网
LoadBalancer这个service type只有在底层的基础架构支持了自动创建load balancer的时候kubernetes才支持，比如Google Cloud Platform和aws。
ExternalIP
如果一个service可以路由到一个或者多个worker node上，那么它可以被映射到一个ExternalIP地址。通过这个ExternalIP进入到集群的流量会被路由到其中一个endpoint上。
需要注意的是，ExternalIP并不是由k8s自动管理的，是由管理员手动设置路由到其中的一个node上的。
ExternalName
ExternalName是一个特定的service type，这种service type没有任何的selector也没有任何声明的endpoint。当在集群中访问到这个service的时候，会返回一个外部服务的CNAME。
这个service一般是用来让一个外部的服务在集群内部可以访问到的，比如我们有一个外部服务叫做my-database.example.com，那么我们可以通过设置ExternalName类型的Service，让内部的其它service通过my-database之类的名字访问到这个服务。


Kubernetes Building Blocks
2017-12-22T15:44:37.000Z
Kubernetes中有很多积木（Building Blocks），比如object model，pod，rs，deployment，namespace之类，这些都是kubernetes中很重要的东西。
Kubernetes Object Model
kubernetes有一个非常完善的对象模型，kubernetes集群可以通过这个对象模型来表现出不同的持久化的整体，比如：
我们是在哪个node上运行哪个容器化的应用程序？
应用程序资源消耗
应用程序不同的策略
对于每个对象，我们用spec这个field声明我们期望的状态，随后kubernetes会通过status这个field记录对象实际的状态并加以管理。随后，kubernetes的controller manager会想办法让这个对象实际的状态和我们声明期望的状态相同。
kubernetes中的例子比如：Pods，Deployments，ReplicaSets之类。
如果我们要创建一个对象，我们需要把spec这个field提供给API Server，这个field会描述我们期望的状态以及一些基础的信息，比如名称。创建对象的API请求必须有spec这个field以及其它详细信息，并且需要是JSON的格式。一般情况下，我们用yaml格式来提供一个对象的声明，kubectl会把这个声明转换成JSON格式，然后传给API Server。
下面是一个Deployment对象的例子：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
    replicas: 3
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
             - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80
插播一条广告：
Apps
The core workloads API, which is composed of the DaemonSet, Deployment, ReplicaSet, and StatefulSet kinds, has been promoted to GA stability in the apps/v1 group version. As such, the apps/v1beta2 group version is deprecated, and all new code should use the kinds in the apps/v1 group version.
接着说，apiVersion指定了我们调用的api的endpoint；通过kind field，我们指定了我们要创建的对象的类型；通过metadata，我们给对象附加上了最基本的信息，比如名字；你可以发现这里面有两个spec的field（spec和spec.template.spec），通过 spec，我们定义了我们对deployment的期望状态，在我们的例子中，我们想要确认，在任何时候，都有至少3个pod在运行。我们再在spec.template.spec里面定义我们要运行的每个pod都应该是什么状态，所以这就是为啥这里会有两个spec的原因。
一旦这个对象被创建了，kubernetes会直接给对象添加一个status的field，如下：
Pods
Pod是kubernetes中最简单也是最小的一个对象，是kubernetes部署的一个单元，代表了应用的一个单一实例。一个Pod是一个或者多个容器的逻辑上的集合，这些容器拥有以下的特性：
在同一个host上一起进行调度
共享同一个network namespace
挂载同样的external storage（volumes）
Pod并非一个持久化的东西，很有可能突然挂了，并且没有能力自我修复，这就是为啥我们把它们和controller一起用，这样可以来控制pod的replica，容错，自我修复等等。比较有名的例子比如Deployments，ReplicaSets等。我们通过把Pod的定义（specification，也就是spec）附加到别的对象（也就是之前用的template.spec）来完成。
Labels
Labels都是键值对，这些键值对可以被attach到kubernetes的对象上，比如Pod。Labels一般被用来组织和选择一些符合条件的对象。label不提供唯一性。
通过这个图片，我们可以看到我们用了两个label：app和env。基于我们的需求，我们可以给我们的pod不同的值。
Label Selectors
通过Label  Selectors，我们可以选择一系列的对象，Kubernetes支持两种Selector类型：
Equality-Based Selectors
顾名思义，这种selector通过 == 或者 != 来进行选择，比如我们选择一个 env==dev 的对象，就会找出所有有env label，并且值为dev的。
Set-Based Selectors
这种selector支持通过一系列的值来进行过滤，比如通过in, notin和exist。
举例：env in (dev, qa)
Replication Controllers
一个 ReplicationController（rc）是master node上Controller Manager的一部分，主要作用是保证每个pod的replica都达到了预期值。不然的话会通过杀死或者新建pod的办法来达到。不过现在已经被ReplicaSet(rs)取代了。
Replica Sets
Replica Set是下一代的Replication Controller，好处在于同时支持equality 和 set based selector（rc只支持equality-based）。目前这是唯一的区别。
Rs可以单独使用，不过一般是配合deployment一起用。Deployment会自动创建rs来管理下面的pod。
Deployment
deployment提供了对于pod和rs的陈述性更新。DeploymentController是master node上Controller Manager的一部分，作用和Controller manager别的一样——确保当前的状态和期望的状态相同。
在下面这个例子中，我们的deployment创建了一个 rs A，然后rs A又创建了3个pod，并且在每个pod中，都有一个跑了nginx:1.7.9镜像的容器。
接下来，在下一个deployment中，我们修改了pod的template，把nginx从1.7.9升级到了1.9.1。因为我们升级了期望的状态，所以deployment会创建一个新的rs B，这个过程被称为Deployment rollout：
当rs B创建完毕的时候，deployment开始指向它：
在rs之上，deployment提供了很多特性比如recording，通过这个特性，如果说更新出错，或者更新后的应用出了bug，我们可以rollback到原先的状态。
Namespaces
如果我们有无数个用户，我们想把这些用户组织到不同的team或者project，我们可以通过namespace把kubernetes集群分成好多个小集群。所有在namespace中创建的resources/objects都是唯一的，不会跨命名空间。
一般来说，k8s会有两个默认namespace：kube-system和default。kube-system一般会用来放一些kubernetes系统的组件，default会用来放一些属于其它namespace的对象。我们默认情况下是会连接到default命名空间。kube-public是一个特殊的namespace，可以被所有的用户读，一般用于特殊情况比如初始化一个集群。
我们可以通过使用资源配额（Resource Quotas）来限制每个命名空间的资源。
最后再插播一条广告：



Kubernetes安装
2017-12-22T09:43:49.000Z
在这篇文章里，会主要记录一下kubernetes安装相关的信息。
Kubernetes 设置
Kubernetes可以通过不同的设置安装，比较普遍的四种安装方法如下：
All-in-One Single-Node Installation
在这种模式下，所有的master和worker组件都被安装在一个node上，这对学习、开发和测试非常有用，但是不应该被用在生产环境中。minikube就是一个例子。
Single-Node etcd, Single-Master, and Multi-Worker Installation
在这种模式下，我们有一个单独的master node，在这个master node上同时也跑了一个单节点的etcd实例。多个worker node都连接到这一个master node。
Single-Node etcd, Multi-Master, and Multi-Worker Installation
在这种模式下，我们有多个Master node，master node将会在HA模式下工作，但是我们只有一个单节点的etcd实例。多个的worker node都会连接到多个master node上去。
Multi-Node etcd, Multi-Master, and Multi-Worker Installation
在这种模式下，etcd被设置成了集群模式，并且在kubernetes集群之外。所有的Node都会连接到它上面去。所有的master node都被设置为HA模式，并且连接到所有的worker node上。Production都应该这么玩。
Kubernetes需要的基础设施
当我们决定了安装的类型，我们同时需要决定一下基础架构相关的决定，比如：
我们应该在裸机上安装k8s，还是在公有云，还是在私有云？
我们应该用哪种操作系统？RHEL，CoreOS，CentOS？
我们应该用哪种网络解决方案？
以及其它的。
本地安装
本地安装推荐使用 minikube。
在虚拟机或者裸机上
kubernetes都支持安装在虚拟机或者裸机上，有很多工具比如ansible和kubeadm同时支持这两种安装。
安装在云上
这个就不用多说了，交保护费即可。
Kubernetes安装工具
目前比较有名的有三个：kubeadm, kubespray, kops。
区别在于，kubeadm支持任何环境，kubespray是基于ansible的，kops目前和aws和gce强耦合。


Kubernetes 架构 Overview
2017-12-22T05:51:13.000Z
最近正在复习准备考试，于是一边复习一遍写成博客，印证自己所学。
Kubernetes架构
从高层看，kubernetes是由如下东西组成的：
一个或多个master node
一个或多个worker node
一个分布式的key-value存储，比如etcd
Master Node
Master node 是集群管理者，我们发出的所有请求都是到master node的api server上。
一个集群可以有多个master node做HA，当有多个master node的时候，只有一个会提供服务，剩下的都是follower。
集群的状态一般存储在etcd里面，所有的master node都会连接到etcd。etcd是一个分布式k-v存储。etcd可以是master内部的，也可以是外部的。
Master node的组件
master node一般都有如下组件：
API Server
所有的操作都是通过 API Server 去完成的。每个用户/操作者通过发送REST请求到api server，然后api server先验证然后执行这些操作。在执行完之后把集群的状态存到etcd里面。
Scheduler
顾名思义，Scheduler的作用是调度，Scheduler拥有所有worker node的资源使用情况，同时也知道用户设置的资源需求，比如说一个 disk=ssd的label。在调度之前，scheduler还会考虑到service requirements，data locality，affinity，anti-affinity等。scheduler负责的是service和pod的调度。
Controller Manager
简单来说，Controller Manager是负责启动和关闭pod的。Controller Manager的任务是让集群维持在期望的状态上。Controller Manager知道每个Pod的状态应该是什么样，然后会不断检测是否有不达标的pod。
Worker Node
Worker Node就是一个被master node控制的机器，Pod一般都是调度到worker node里面的。Worker node会有一些可以运行以及连接容器的工具。Pod是kubernetes里面的调度单元，是一个或多个容器组成的通常一起调度的逻辑上的集合。
Worker Node组件
一个worker node一般会有以下组件：
Contrainer Runtime
不用多说了，运行容器必备的，默认用的是Docker
kubelet
kubelet是在每个worker node上都会运行的，用来和master node通信的。kubelet从master接收pod的定义，然后启动里面的容器，并监控容器是否一直正常运行。
kube-proxy
kube-proxy简单来说，就是对外提供代理服务的。换句话说，没有kube-proxy，我们要访问其中的application，就得直接访问到worker node上，这显然是不合理的。我们可以通过kube-proxy来做load balancer等。以前版本的Service也借助了kube-proxy。
用etcd来管理状态
在kubernetes里面，都是用的etcd来管理所有的状态。除了集群的状态之外，还会用来存放一些信息，比如configmap，secret。
网络需求
为了启动一个全功能的kubernetes集群，我们需要先确认以下信息：
每个Pod有唯一一个独立的IP
每个Pod里面的容器可以互相沟通
Pod之间可以互相沟通
通过设置，在Pod里面的application可以被外部访问到
这些问题都是需要在部署之前被解决的。
我们一个个看：
给每个Pod分配一个独立的IP
在kubernetes里面，每个Pod都要有一个独立的IP。一般容器网络有两种规格：
Container Network Model (CNM)
Container Network Interface (CNI)
Kubernetes用CNI来给Pod分配IP
简单来说，容器运行时向CNI申请IP，然后CNI通过其下面指定的plugin来获取到IP，并且返回给容器运行时。
容器之间交流
一般基于底层操作系统的帮助，所有的容器运行时都会给每个容器创建一个独立的隔离的网络整体。在Linux上，这个整体被称为Network Namespace，这些Network Namespace可以在容器之间共享。
在一个Pod里面，容器共享Network Namespace，所以所有在同一个Pod里面的容器可以通过localhost来互相访问。
跨Node的Pod之间访问
在一个集群的环境下，每个Pod可以被调度到任何一个Node上，我们需要让在不同机器上的Pod也可以相互通信，并且任何Node都可以访问到任何Pod。Kubernetes设定了一个条件：不能有任何的NAT转换，我们可以通过以下方式来达成：
可路由（Routable）的Pod和Node，通过底层的服务，比如GCE。
通过一些软件定义的网络（Software Defined Networking），比如flannel，weave，calico等
更多的信息可以看看kubernetes的官方文档。
外网和集群之间的访问
我们可以通过kube-proxy来暴露我们的service，然后就能从外面访问到我们集群里面的应用了。


《Head First 设计模式》读书笔记0.5 —— 引子
2017-12-21T09:23:12.000Z
为什么引子我还要写一篇文章呢？因为引子介绍了很多关于大脑认知的知识，这本书运用了其中的很多知识来写作，这也是这本书为什么如此火如此出名的原因。我认为这可能会对我工作或者学习产生帮助，所以记录下来。
大脑总是渴求一些奇怪的东西
好吧，原文意思是，大脑总是渴求一些新奇的东西，或者不寻常的事物发生，我们的大脑不会注意一些习以为常的东西，比如我们不会注意很平常的路人，但是会注意到很多“特立独行”的人。
比如说，当你拿到一本500页的教科书，书上密密麻麻都是文字，你的大脑肯定想着“**，又是这种玩意儿，无聊……”
但是如果当你拿到一本 日本H二次元漫画，还是 时崎狂三 或者 穹妹 的这个时候你的大脑就会……
或者再举个例子，如果你就普通的在路上走，你的大脑会努力的去排除那些不重要的东西，但是如果你走着走着，突然你面前蹦出一个大老虎，你的大脑肯定一下子就情绪爆发（原文）了。
Head first系列通过一些最新的认知科学、神经生物学和教育心理学来创作，有以下一些原则：
看得到。与单纯的文字相比，图片更能让人记得住，通过图片，学习效率会更高，甚至能有多达89%的提高。
采用一种针对个人式的交谈式风格。
让学习的人想得更深。
引起读者的注意，而且要让他一直保持注意。
影响读者的情绪。


使用 kubeadm 创建一个 kubernetes 集群
2017-12-17T09:22:34.000Z
简介
kubeadm是一个kubernetes官方提供的快速安装和初始化拥有最佳实践（best practice）的kubernetes集群的工具，虽然目前还处于 beta 和 alpha 状态，还不能用在生产环境，但是我们可以通过学习这种部署方法来体会一些官方推荐的kubernetes最佳实践的设计和思想。
kubeadm的目标是提供一个最小可用的可以通过Kubernetes一致性测试的集群，所以并不会安装任何除此之外的非必须的addon。
kubeadm默认情况下并不会安装一个网络解决方案，所以用kubeadm安装完之后 需要自己来安装一个网络的插件。
使用
系统环境
kubeadm支持多种系统，这里简单介绍一下需要的系统要求：
Ubuntu16.04+ / Debian 9 / CentOS 7 / RHEL 7 / Fedora 25/26(best-effort) / HypriotOS v1.0.1+ / Other
2GB或者以上的RAM（否则将没有足够空间留给app）
2核以上CPU
集群的机器之间必须能通过网络互相通信
SWAP必须被关闭，否则kubelet会出错！
具体的详细信息可以在官方网站上看到。
本篇内容基于aws的ap-northeast-1的ec2，CentOS 7 的操作系统（ami-4dd5522b），实例类型t2.medium 2核4GB，3台机器，1 master，2 nodes，kubernetes 1.9 版本。为了方便起见，在安全组里面打开了所有的端口和IP访问。
机器配置：
1
2
[centos@ip-172-31-24-49 ~]$ uname -a
Linux ip-172-31-24-49.ap-northeast-1.compute.internal 3.10.0-693.5.2.el7.x86_64 #1 SMP Fri Oct 20 20:32:50 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
首先 ，我们关闭selinux：
1
$ sudo vim /etc/sysconfig/selinux
把SELINUX改成disabled，然后保存退出。
在我用的ami中，swap是默认关闭的，所以不需要我手动关闭，大家需要确认 自己的环境中swap是否有关闭掉，否则会在之后的环节中出问题。
为了方便我们安装，我们将sshd设置为keepalive：
1
2
3
4
$ sudo -i
$ echo "ClientAliveInterval 10" >> /etc/ssh/sshd_config
$ echo "TCPKeepAlive yes" >> /etc/ssh/sshd_config
$ systemctl restart sshd.service
接下来我们重启一下机器：
1
2
$ sudo sync
$ sudo reboot
至此，准备阶段结束。
安装kubeadm
首先，我们需要在所有机器上都安装docker, kubeadm, kubelet和kubectl。
切记：**kubeadm不会自动去安装和管理 kubelet和kubectl，所以需要自己去确保安装的版本和你想要安装的kubernetes版本相同。**
安装docker：
1
2
$ sudo yum install -y docker
$ sudo systemctl enable docker && sudo systemctl start docker
在RHEL/CentOS 7 系统上可能会路由失败，我们需要设置一下：
1
2
3
4
5
6
$ sudo -i
$ cat <<EOF >  /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
$ sudo sysctl --system
接下来我们需要安装kubeadm, kubelet和kubectl了，我们需要先加一个repo：
1
2
3
4
5
6
7
8
9
$ cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://packages.cloud.google.com/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg
EOF
然后安装：
1
2
$ sudo yum install -y kubelet kubeadm kubectl
$ sudo systemctl enable kubelet && sudo systemctl start kubelet
至此，在所有机器上安装所需的软件已经结束。
使用kubeadm初始化master
安装完所有的依赖之后，我们就可以用kubeadm初始化master了。
最简单的初始化方法是：
1
$ kubeadm init
除此之外，kubeadm还支持多种方法来配置，具体可以查看一下官方文档。
我们在初始化的时候指定一下kubernetes版本，并设置一下pod-network-cidr（后面的flannel会用到）：
1
2
$ sudo -i
$ kubeadm init --kubernetes-version=v1.9.0 --pod-network-cidr=10.244.0.0/16
在这个过程中kubeadm执行了一系列的操作，包括一些pre-check，生成ca证书，安装etcd和其它控制组件等。
界面差不多如下：
最下面的这行kubeadm join什么的，就是用来让别的node加入集群的，可以看出非常方便。我们要保存好这一行东西，这是我们之后让node加入集群的凭据，一会儿会用到。
这个时候，我们还不能通过kubectl来控制集群，要让kubectl可用，我们需要做：
1
2
3
4
5
6
7
8
9
# 对于非root用户
$ mkdir -p $HOME/.kube
$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
$ sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 对于root用户
$ export KUBECONFIG=/etc/kubernetes/admin.conf
# 也可以直接放到~/.bash_profile
$ echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
接下来要注意，我们必须自己来安装一个network  addon。
network addon必须在任何app部署之前安装好。同样的，kube-dns也会在network addon安装好之后才启动。kubeadm只支持CNI-based networks（不支持kubenet）。
比较常见的network addon有：Calico, Canal, Flannel, Kube-router, Romana, Weave Net等。这里我们使用Flannel。
1
$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/v0.9.1/Documentation/kube-flannel.yml
安装完network之后，你可以通过kubectl get pods --all-namespaces来查看kube-dns是否在running来判断network是否安装成功。
默认情况下，为了保证master的安全，master是不会被调度到app的。你可以取消这个限制通过输入：
1
$ kubectl taint nodes --all node-role.kubernetes.io/master-
加入nodes
终于部署完了我们的master！
现在我们开始加入一些node到我们的集群里面吧！
ssh到我们的node节点上，执行刚才下面给出的那个 kubeadm join的命令（每个人不同）：
1
2
$ sudo -i
$ kubeadm join --token 72a8a4.2ed9076cd668b8b7 172.31.31.60:6443 --discovery-token-ca-cert-hash sha256:f0894e55d475f882dd40d52c6d01f758017ec5729be632294049f687330f60d2
输出差不多如下图：
这时候，我们去master上输入kubectl get nodes查看一下：
1
2
3
4
5
[root@i-071abd86ed304dc84 ~]# kubectl get nodes
NAME                  STATUS    ROLES     AGE       VERSION
i-071abd86ed304dc84   Ready     master    12m       v1.9.0
i-0c559ad3c0b16fd36   Ready         1m        v1.9.0
i-0f3f7462b0a004b5e   Ready         47s       v1.9.0
成功！
总结
我们可以看到，用kubeadm部署可以让我们比手动部署方便得多，虽然比不上kops这样的一键部署生产Kubernetes集群的工具，但是kubeadm最初的设计也并非是傻瓜式使用。
kubeadm给了用户很多的灵活性，让用户可以完全自定义地去配置自己的集群。
不过目前（截止博客发布为止），kubeadm还只是在测试，官方还不建议在生产环境中使用，不过预计会在2018年春季可以投入生产使用。
最后，我们总结一下kubeadm最核心的几个概念：
官方认为的 最佳实践（best-practice）
合理的安全（reasonably secure）
可扩展（extensible）
最小可用（minimum viable）


CAS认证
2017-12-14T01:51:49.000Z
工作需要学习CAS，所以边学边写博客来印证自己所学。
CAS——Central Authentication Service，集中式认证服务，顾名思义就是把一个网站群的用户认证挪到同一个地方去进行。
架构
CAS架构如下图：
可以看出来，CAS主要是用在网站群里面。想想也是，如果有好多个网站都需要用户认证，不可能每个网站自己维护一套用户认证系统，不然维护和开发起来不是太麻烦了，所以需要把用户认证挪到同一个地方去集中地进行，这就是CAS的思想。
CAS服务器和App服务器通过协议进行交互，其实也就是相当于我们经常说的“解耦”，把用户认证的体系给单独剥离出来，使得用户认证体系可以在所有网站中复用。这么说来还有点微服务的意思？其实很多想法都是殊途同归的。
流程图
这是CAS主要的流程，简单来说就是在访问服务器的时候，如果发现没有session，就去CAS Server验证一下，CAS的TGT是为了不让用户重复登录的一个ticket。
CAS Server验证完了身份，就给一个ST，让用户拿给app，app用ST去CAS Server获取到用户的信息，于是创建session。


《Head First 设计模式》读书笔记0 —— 总览
2017-12-11T11:56:07.000Z
开始看《Head First 设计模式》，接下来（可能）会写一系列的博客关于设计模式，先在这里挖个坑。。。
为什么要学设计模式
因为有些人已经解决你的问题了。你的问题别人已经遇到过了，也解决了，我们应该学习别人的经验并进行复用。
设计模式大都是一些良好的OO实践，其中能反映出很多OO的设计原则。
使用模式最好的方法是：“把模式装进脑子里，然后在你的设计和已有的应用中，寻找何处可以使用它们。”
大致有哪些设计模式
观察者模式
让你的对象知悉现状
有趣的事情发生时，可千万别错过了！
装饰者模式
装饰对象
给爱用继承的人一个全新的设计眼界
工厂模式
烘烤OO的精华
装备好开始烘烤某些松耦合的OO设计。
单实例模式
独一无二的对象
单实例模式：用来创建独一无二的，只能有一个实例的对象的入场券。
命令模式
封装调用
把封装带到一个全新的境界：把方法调用封装起来。
适配器模式与外观模式
随遇而安
把方块放进圆洞中。
模板方法模式
封装算法
封装完对象……接下来呢？
迭代器与组合模式
管理良好的集合
有许多种方法可以把对象堆起来成为一个集合。
状态模式
事物的状态
基本常识：策略模式和状态模式是双胞胎，在出生时才分开。
代理模式
控制对象访问
玩过扮白脸、扮黑脸的游戏吗？
复合模式
模式中的模式
谁料得到模式居然可以携手合作？
与设计模式相处
真实世界中的模式
现在你已经准备好迎接一个充满设计模式的崭新世界。
其它设计模式
略……


如何在Mac上卸载Python
2017-05-21T09:47:46.000Z

Remove the Python 2.7 framework
sudo rm -rf /Library/Frameworks/Python.framework/Versions/2.7

Remove the Python 2.7 applications directory
sudo rm -rf "/Applications/Python 2.7"

Remove the symbolic links in /usr/local/bin that point to this Python version see ls -l /usr/local/bin | grep '../Library/Frameworks/Python.framework/Versions/2.7' and then run the following command to remove all the links:
1
2
cd /usr/local/bin/
ls -l /usr/local/bin | grep '../Library/Frameworks/Python.framework/Versions/2.7' | awk '{print $9}' | tr -d @ | xargs rm


If necessary, edit your shell profile file(s) to remove adding /Library/Frameworks/Python.framework/Versions/2.7 to your PATH environment file. Depending on which shell you use, any of the following files may have been modified: ~/.bash_login, ~/.bash_profile, ~/.cshrc, ~/.profile, ~/.tcshrc, and/or ~/.zprofile.




MySql存储引擎的比较
2017-05-19T16:44:21.000Z
众所周知，MySql提供了很多存储引擎，这里来比较一下常见引擎的优劣。
查看所有存储引擎
我们可以通过show engines命令来看到我们的mysql server提供了哪些引擎：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
show engines;
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| Engine             | Support | Comment                                                        | Transactions | XA   | Savepoints |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| InnoDB             | DEFAULT | Supports transactions, row-level locking, and foreign keys     | YES          | YES  | YES        |
| MRG_MYISAM         | YES     | Collection of identical MyISAM tables                          | NO           | NO   | NO         |
| MEMORY             | YES     | Hash based, stored in memory, useful for temporary tables      | NO           | NO   | NO         |
| BLACKHOLE          | YES     | /dev/null storage engine (anything you write to it disappears) | NO           | NO   | NO         |
| MyISAM             | YES     | MyISAM storage engine                                          | NO           | NO   | NO         |
| CSV                | YES     | CSV storage engine                                             | NO           | NO   | NO         |
| ARCHIVE            | YES     | Archive storage engine                                         | NO           | NO   | NO         |
| PERFORMANCE_SCHEMA | YES     | Performance Schema                                             | NO           | NO   | NO         |
| FEDERATED          | NO      | Federated MySQL storage engine                                 | NULL         | NULL | NULL       |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
9 rows in set (0.00 sec)
InnoDB 存储引擎
InnoDB是事务性数据库的首选引擎，支持事务安全表（ACID），支持行锁定和外键。MySQL5.5.5之后，InnoDB作为默认存储引擎。InnoDB主要特性有：
InnoDB给MySQL提供了具有提交、回滚和崩溃恢复能力的事务安全（ACID兼容）存储引擎。InnoDB锁定在行级并且也在SELECT语句中提供一个类似Oracle的非锁定读。这些功能增加了多用户部署和性能。在SQL查询中，可以自由地将InnoDB类型的表与其他MySQL的表的类型混合起来，甚至在同一个查询中也可以混合。
InnoDB是为处理巨大数据量所设计的性能为重的，它的CPU效率可能是任何其他基于磁盘的关系数据库引擎所不能匹敌的。
InnoDB存储引擎完全与MySQL服务器整合，InnoDB存储引擎在主内存中维持了自己的缓冲池来缓存数据和索引。InnoDB将它的表和索引存在一个逻辑表空间中，表空间可以包含数个文件（或原始磁盘分区）。这与MyISAM表不同，比如在MyISAM表中每个表被存在分离的文件中。InnoDB表可以是任何尺寸，即使在文件尺寸被限制在2GB的操作系统上。
InnoDB支持外键完整性约束（FOREIGN KEY）。存储表中的数据时，每张表的存储都按主键顺序存放，如果没有显式在表定义时制定主键，InnoDB会为每一行生成一个6B的ROWID，并以此作为主键。
InnoDB被用在众多需要高性能的大型数据库站点上。
InnoDB不创建目录，使用InnoDB时，MySQL将在MySQL数据目录下创建一个名为ibdata1的10MB大小的自动扩展数据文件，以及两个名为ib_logfile0和ib_logfile1的5MB大小的日志文件。
MyISAM 存储引擎
MyISAM是基于ISAM的存储引擎，并对其进行扩展。它是在Web、数据存储和其他应用环境下最常使用的存储引擎之一。MyISAM拥有较高的插入、查询速度，但不支持事务。在MySQL5.5.5之前的版本中，MyISAM是默认存储引擎。MyISAM主要特性有：
大文件（达63位文件长度）在支持大文件的文件系统和操作系统上被支持。
当把删除、更新及插入操作混合使用的时候，动态尺寸的行产生更少碎片。这要通过合并相邻被删除的块，以及若下一个块被删除，就扩展到下一块来自动完成。
每个MyISAM表最大索引数是64，这可以通过重新编译来改变。每个索引最大的列数是16个。
最大的键长度是1000B，这也可以通过编译来改变。对于键长度超过250B的情况，一个超过1024B的键将被用上。
BLOB和TEXT列可以被索引。
NULL值被允许在索引的列中。这个值占每个键的0-1个字节。
所有数字键值以高字节优先被存储以允许一个更高的索引压缩。
每表一个AUTO_INCREMENT列的内部处理。MyISAM为INSERT和UPDATE操作自动更新这一列。这使得AUTO_INCREMENT列更快（至少10%）。在序列项的值被删除之后就不能再利用。
可以把数据文件和索引文件放在不同目录。
每个字符列可以有不同的字符集。
有VARCHAR的表可以固定或动态记录长度。
VARCHAR和CHAR列可以多达64KB。
使用MyISAM引擎创建数据库，将产生3个文件。文件的名字以表的名字开始，扩展名代表了文件的类型：frm文件存储表定义，myd代表数据文件，myi代表索引文件。
MEMORY 存储引擎
MEMORY存储引擎将表中的数据存储到内存中，为查询和引用其他表数据提供快速访问。MEMORY主要特性有：
MEMORY表的每个表可以有多达32个索引，每个索引16列，以及500B的最大键长度。
MEMORY存储引擎执行HASH 和 BTREE索引。
可以在一个MEMORY表中有非唯一键。
MEMORY表使用一个固定的记录长度格式。
MEMORY不支持BLOG或TEXT列。
MEMORY支持AUTO_INCREMENT列和对可包含NULL值的列的索引。
MEMORY表在所有客户端之间共享（就像其他任何非TEMPORARY表）。
MEMORY表内容被存在内存中，内存是MEMORY表和服务器在查询处理时的空闲中创建的内部表共享的。
当不再需要MEMORY表的内容时，要释放被MEMORY表使用的内存，应该执行DELETE FROM或TRUNCATE TABLE，或者删除整个表（用DROP TABLE）。


如何选择开源协议
2017-05-16T04:13:31.000Z



交叉编译Go程序
2017-05-12T14:08:45.000Z
你只需设置 GOOS 和 **GOARCH **两个环境变量就能生成所需平台的Go程序。
比如使用下面的代码测试：
1
2
3
4
5
6
7
8
package main

import "fmt"
import "runtime"

func main() {
    fmt.Printf("OS: %s\nArchitecture: %s\n", runtime.GOOS, runtime.GOARCH)
}
编译它： $ GOOS=darwin GOARCH=386 go build test.go
就可以生成运行在OS X上的程序。
可用的OS和ARCH的值如下：
$GOOS $GOARCH
darwin 386
darwin amd64
darwin arm
darwin arm64
dragonfly amd64
freebsd 386
freebsd amd64
freebsd arm
linux 386
linux amd64
linux arm
linux arm64
linux ppc64
linux ppc64le
netbsd 386
netbsd amd64
netbsd arm
openbsd 386
openbsd amd64
openbsd arm
plan9 386
plan9 amd64
solaris amd64
windows 386
windows amd64
不同的操作系统下的库可能有不同的实现， 比如syscall库。go build没有内置的#define或者预处理器之类的处理平台相关的代码取舍， 而是采用tag和文件后缀的方式实现。
tag方式
tag遵循一下规则
a build tag is evaluated as the OR of space-separated options
each option evaluates as the AND of its comma-separated terms
each term is an alphanumeric word or, preceded by !, its negation
在文件的头部增加tag:
1
// +build darwin freebsd netbsd openbsd
可以有多个tag,之间是AND的关系
1
2
// +build linux darwin
// +build 386
注意tag和package中间需要有空行分隔，下面的例子是不对的:
1
2
// +build !linux
package mypkg // wrong
文件后缀方式
以*_$GOOS.go*为后缀的文件只在此平台上编译，其它平台上编译时就当此文件不存在。完整的后缀如：
1
_$GOOS_$GOARCH.go
如syscall_linux_amd64.go,syscall_windows_386.go,syscall_windows.go等。


在debian8 jessie上安装openjdk-8-jre-headless 或者 oracle-java8-install
2017-05-09T18:33:43.000Z
最近在折腾docker，写Dockerfile的时候需要在jessie里面安装openjdk-8-jre，一直失败，网上搜罗了一圈，尝试了N种方法终于有一个work的，记录下来。
1
2
3
echo "deb http://http.debian.net/debian jessie-backports main" > /etc/apt/sources.list.d/jessie-backports.list
apt-get update
apt-get install -y -t jessie-backports openjdk-8-jre-headless ca-certificates-java
这样就OK啦！
如果需要装oracle java并自动选择同意的话：
1
2
echo oracle-java8-installer shared/accepted-oracle-license-v1-1 select true | sudo /usr/bin/debconf-set-selections
apt-get install -y oracle-java8-installer
就可以了！


将Django从1.7升级到1.8小计
2017-05-07T22:12:27.000Z
之前在项目中将Django从1.7升级到1.8，现在想起来记录一下相关的步骤和过程。
由于项目一开始用的是1.6，所以用python manage.py startapp默认没有migrations这个package，而之前又有一些model是使用syncdb的，并且之后再没修改过，所以在用1.7的时候一直都没什么问题，而且1.7会自动去侦测没有makemigrations的model并自动migrate，导致了在升级1.8的过程中出现了一些小插曲，这里来记录一下。
1.7和1.8在migrate时的顺序不同（具体可以看一下源代码），所以导致了1.7能正常migrate，但是在1.8的时候会报错ColoumDoesNotExist，解决方案是看看报错信息中到底说的是哪个表没有渲染成功。我们只要先给这个app makemigrations就可以了，如果还出错的话就追根溯源到第一个报错的表，然后按顺序一个一个去makemigrations即可。
解决了migrations的差异之后，1.7和1.8基本是完全兼容的，别的都不需要进行修改。不过升级到1.8之后就算在debug模式下127.0.0.1默认也不在settings中的ALLOWED_HOSTS中了，所以需要添加进去才能在本地访问。
还有就是1.8用了新的TEMPLATES的设置方法，具体的看看文档稍微修改下就好了，非常简单问题不大。
附上1.8要回退1.7的脚本（经测试有效）：
1
2
3
python manage.py migrate auth 0001
python manage.py migrate contenttypes 0001
pip install django==1.7.11



ubuntu+nginx下使用letsencrypt加密https
2017-05-06T12:34:47.000Z
因为服务器太乱，我清理了一下服务器并且重新使用letsencrypt加密了https，现在将我的经验分享出来。
本文基于ubuntu16.04、nginx环境
第一步：安装 Certbot
第一步是安装letsencrypt提供的certbot工具
1
2
3
sudo add-apt-repository ppa:certbot/certbot
sudo apt-get update
sudo apt-get install certbot
第二步： 获得SSL的证书
我们使用WebRoot这个插件。
这里以nginx的default的site作为示例：
1
vim /etc/nginx/sites-available/default
在server的块中，加入以下内容
1
2
3
location ~ /.well-known {
        allow all;
}
确认root是你网站的根目录，比如默认情况下是/var/www/html
保存退出之后，测试并重启你的nginx：
1
2
sudo nginx -t
sudo nginx -s reload
然后我们获取到相关的SSL证书：
1
sudo certbot certonly --webroot --webroot-path=/var/www/html -d example.com -d www.example.com -d third.another.com
记得把上面的/var/www/html改成你自己的网站根目录。如果需要同时对多个域名进行认证的话只要同时使用多个-d就可以了，并且这些域名并不一定都需要为example.com，可以为别的域名。
然后根据提示，输入对应的信息，如果完成后应该会看到类似的信息：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
IMPORTANT NOTES:
 - Congratulations! Your certificate and chain have been saved at
   /etc/letsencrypt/live/example.com/fullchain.pem. Your cert
   will expire on 2017-07-26. To obtain a new or tweaked version of
   this certificate in the future, simply run certbot again. To
   non-interactively renew *all* of your certificates, run "certbot
   renew"
 - If you lose your account credentials, you can recover through
   e-mails sent to sammy@example.com.
 - Your account credentials have been saved in your Certbot
   configuration directory at /etc/letsencrypt. You should make a
   secure backup of this folder now. This configuration directory will
   also contain certificates and private keys obtained by Certbot so
   making regular backups of this folder is ideal.
 - If you like Certbot, please consider supporting our work by:

   Donating to ISRG / Let's Encrypt:   https://letsencrypt.org/donate
   Donating to EFF:                    https://eff.org/donate-le
认证成功后，我们来生成一下更强的dhparam：
1
sudo openssl dhparam -out /etc/ssl/certs/dhparam.pem 2048
这一步应该会消耗一定的时间
第三步：在nginx上设置TLS/SSL
我们先创建一个新的脚本：
1
sudo vim /etc/nginx/snippets/ssl-example.com.conf
内容如下：
1
2
ssl_certificate /etc/letsencrypt/live/example.com/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/example.com/privkey.pem;
保存退出后，再创建一个脚本用来设置ssl的参数：
1
sudo vim /etc/nginx/snippets/ssl-params.conf
内容如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# from https://cipherli.st/
# and https://raymii.org/s/tutorials/Strong_SSL_Security_On_nginx.html

ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
ssl_prefer_server_ciphers on;
ssl_ciphers "EECDH+AESGCM:EDH+AESGCM:AES256+EECDH:AES256+EDH";
ssl_ecdh_curve secp384r1;
ssl_session_cache shared:SSL:10m;
ssl_session_tickets off;
ssl_stapling on;
ssl_stapling_verify on;
resolver 8.8.8.8 8.8.4.4 valid=300s;
resolver_timeout 5s;
# disable HSTS header for now
#add_header Strict-Transport-Security "max-age=63072000; includeSubDomains; preload";
add_header X-Frame-Options DENY;
add_header X-Content-Type-Options nosniff;

ssl_dhparam /etc/ssl/certs/dhparam.pem;
保存退出。
然后修改一下site的配置文件：
1
sudo vim /etc/nginx/sites-available/default
改成这样：
1
2
3
4
5
6
7
8
9
10
11
server {
    listen 80 default_server;
    listen [::]:80 default_server;
    listen 443 ssl http2 default_server;
    listen [::]:443 ssl http2 default_server;

    server_name example.com www.example.com;
    include snippets/ssl-example.com.conf;
    include snippets/ssl-params.conf;

    . . .
保存退出。
第四步：在防火墙中Allow Nginx
执行以下脚本：
1
2
3
sudo ufw allow 'Nginx Full'
sudo nginx -t
sudo nginx -s reload
第五步：自动更新SSL证书
因为letsencrypt提供的证书是有期限的，所以我们需要设置自动更新证书。
执行命令：
1
sudo crontab -e
在最后加上这么一行：
1
30 0 * * 1 /usr/bin/certbot renew --quiet --renew-hook "/bin/systemctl reload nginx"
完成！


Docker基础技术——AUFS
2017-05-06T08:23:43.000Z
最近在学习docker，看到了一篇比较好的文章，于是转载了过来，原文出处在最后。
AUFS是一种Union File System，所谓UnionFS就是把不同物理位置的目录合并mount到同一个目录中。UnionFS的一个最主要的应用是，把一张CD/DVD和一个硬盘目录给联合 mount在一起，然后，你就可以对这个只读的CD/DVD上的文件进行修改（当然，修改的文件存于硬盘上的目录里）。
![](http://coolshell.cn//wp-content/uploads/2015/08/docker-filesystems-busyboxrw.png)AUFS又叫Another UnionFS，后来叫Alternative UnionFS，后来可能觉得不够霸气，叫成Advance UnionFS。是个叫Junjiro Okajima（岡島順治郎）在2006年开发的，AUFS完全重写了早期的UnionFS 1.x，其主要目的是为了可靠性和性能，并且引入了一些新的功能，比如可写分支的负载均衡。AUFS在使用上全兼容UnionFS，而且比之前的UnionFS在稳定性和性能上都要好很多，后来的UnionFS 2.x开始抄AUFS中的功能。但是他居然没有进到Linux主干里，就是因为Linus不让，基本上是因为代码量比较多，而且写得烂（相对于只有3000行的union mount和10000行的UnionFS，以及其它平均下来只有6000行代码左右的VFS，AUFS居然有30000行代码），所以，岡島不断地改进代码质量，不断地提交，不断地被Linus拒掉，所以，到今天AUFS都还进不了Linux主干（今天你可以看到AUFS的代码其实还好了，比起OpenSSL好N倍，要么就是Linus对代码的质量要求非常高，要么就是Linus就是不喜欢AUFS）。
不过，好在有很多发行版都用了AUFS，比如：Ubuntu 10.04，Debian6.0, Gentoo Live CD支持AUFS，所以，也OK了。
好了，扯完这些闲话，我们还是看一个示例吧（环境：Ubuntu 14.04）
首先，我们建上两个目录（水果和蔬菜），并在这两个目录中放上一些文件，水果中有苹果和蕃茄，蔬菜有胡萝卜和蕃茄。
然后，我们输入以下命令：
我们可以看到在./mnt目录下有三个文件，苹果apple、胡萝卜carrots和蕃茄tomato。水果和蔬菜的目录被union到了./mnt目录下了。
我们来修改一下其中的文件内容：
上面的示例，我们可以看到./mnt/apple的内容改了，./fruits/apple的内容也改了。
上面的示例，我们可以看到，我们修改了./mnt/carrots的文件内容，./vegetables/carrots并没有变化，反而是./fruits/carrots的目录中出现了carrots文件，其内容是我们在./mnt/carrots里的内容。
也就是说，我们在mount aufs命令中，我们没有指它vegetables和fruits的目录权限，默认上来说，命令行上第一个（最左边）的目录是可读可写的，后面的全都是只读的。（一般来说，最前面的目录应该是可写的，而后面的都应该是只读的）
所以，如果我们像下面这样指定权限来mount aufs，你就会发现有不一样的效果（记得先把上面./fruits/carrots的文件删除了）：
现在，在这情况下，如果我们要修改./mnt/tomato这个文件，那么究竟是哪个文件会被改写？
可见，如果有重复的文件名，在mount命令行上，越往前的就优先级越高。
你可以用这个例子做一些各种各样的试验，我这里主要是给大家一个感性认识，就不展开试验下去了。
那么，这种UnionFS有什么用？
历史上，有一个叫Knoppix的Linux发行版，其主要用于Linux演示、光盘教学、系统急救，以及商业产品的演示，不需要硬盘安装，直接把CD/DVD上的image运行在一个可写的存储设备上（比如一个U盘上），其实，也就是把CD/DVD这个文件系统和USB这个可写的系统给联合mount起来，这样你对CD/DVD上的image做的任何改动都会在被应用在U盘上，于是乎，你可以对CD/DVD上的内容进行任意的修改，因为改动都在U盘上，所以你改不坏原来的东西。
我们可以再发挥一下想像力，你也可以把一个目录，比如你的源代码，作为一个只读的template，和另一个你的working directory给union在一起，然后你就可以做各种修改而不用害怕会把源代码改坏了。有点像一个ad hoc snapshot。
Docker把UnionFS的想像力发挥到了容器的镜像。你是否还记得我在介绍Linux Namespace上篇中用mount namespace和chroot山寨了一镜像。现在当你看过了这个UnionFS的技术后，你是不是就明白了，你完全可以用UnionFS这样的技术做出分层的镜像来。
下图来自Docker的官方文档Layer，其很好的展示了Docker用UnionFS搭建的分层镜像。
关于docker的分层镜像，除了aufs，docker还支持btrfs, devicemapper和vfs，你可以使用 -s 或 –storage-driver= 选项来指定相关的镜像存储。在Ubuntu 14.04下，docker默认Ubuntu的 aufs（在CentOS7下，用的是devicemapper，关于devicemapper，我会以以后的文章中讲解）你可以在下面的目录中查看相关的每个层的镜像：
在docker执行起来后（比如：docker run -it ubuntu /bin/bash ），你可以从/sys/fs/aufs/si_[id]目录下查看aufs的mount的情况，下面是个示例：
你会看到只有最顶上的层（branch）是rw权限，其它的都是ro+wh权限只读的。
关于docker的aufs的配置，你可以在/var/lib/docker/repositories-aufs这个文件中看到。
AUFS的一些特性
AUFS有所有Union FS的特性，把多个目录，合并成同一个目录，并可以为每个需要合并的目录指定相应的权限，实时的添加、删除、修改已经被mount好的目录。而且，他还能在多个可写的branch/dir间进行负载均衡。
上面的例子，我们已经看到AUFS的mount的示例了。下面我们来看一看被union的目录（分支）的相关权限：
rw表示可写可读read-write。
ro表示read-only，如果你不指权限，那么除了第一个外ro是默认值，对于ro分支，其永远不会收到写操作，也不会收到查找whiteout的操作。
rr表示real-read-only，与read-only不同的是，rr标记的是天生就是只读的分支，这样，AUFS可以提高性能，比如不再设置inotify来检查文件变动通知。
权限中，我们看到了一个术语：whiteout，下面我来解释一下这个术语。
一般来说ro的分支都会有wh的属性，比如 “[dir]=ro+wh”。所谓whiteout的意思，如果在union中删除的某个文件，实际上是位于一个readonly的分支（目录）上，那么，在mount的union这个目录中你将看不到这个文件，但是read-only这个层上我们无法做任何的修改，所以，我们就需要对这个readonly目录里的文件作whiteout。AUFS的whiteout的实现是通过在上层的可写的目录下建立对应的whiteout隐藏文件来实现的。
看个例子：
假设我们有三个目录和文件如下所示（test是个空目录）：
我们如下mount：
现在我们在权限为rw的test目录下建个whiteout的隐藏文件.wh.apple，你就会发现./mnt/apple这个文件就消失了:
上面这个操作和 rm ./mnt/apple是一样的。
相关术语
Branch – 就是各个要被union起来的目录（就是我在上面使用的dirs的命令行参数）
Branch根据被union的顺序形成一个stack，一般来说最上面的是可写的，下面的都是只读的。
Branch的stack可以在被mount后进行修改，比如：修改顺序，加入新的branch，或是删除其中的branch，或是直接修改branch的权限
Whiteout 和 Opaque
如果UnionFS中的某个目录被删除了，那么就应该不可见了，就算是在底层的branch中还有这个目录，那也应该不可见了。
Whiteout就是某个上层目录覆盖了下层的相同名字的目录。用于隐藏低层分支的文件，也用于阻止readdir进入低层分支。
Opaque的意思就是不允许任何下层的某个目录显示出来。
在隐藏低层档的情况下，whiteout的名字是’.wh.’。
在阻止readdir的情况下，名字是’.wh..wh..opq’或者 ’.wh.__dir_opaque’。
相关问题
看到上面这些，你一定会有几个问题：
其一、你可能会问，要有文件在原来的地方被修改了会怎么样？mount的目录会一起改变吗？答案是会的，也可以是不会的。因为你可以指定一个叫udba的参数（全称：User’s Direct Branch Access），这个参数有三个取值：
udba=none – 设置上这个参数后，AUFS会运转的更快，因为那些不在mount目录里发生的修改，aufs不会同步过来了，所以会有数据出错的问题。
udba=reval – 设置上这个参数后，AUFS会去查文件有没有被更新，如果有的话，就会把修改拉到mount目录内。
udba=notify – 这个参数会让AUFS为所有的branch注册inotify，这样可以让AUFS在更新文件修改的性能更高一些。
其二、如果有多个rw的branch（目录）被union起来了，那么，当我创建文件的时候，aufs会创建在哪里呢？ aufs提供了一个叫create的参数可以供你来配置相当的创建策略，下面有几个例子。
create=rr | round−robin 轮询。下面的示例可以看到，新创建的文件轮流写到三个目录中
create=mfs[:second] | most−free−space[:second] 选一个可用空间最好的分支。可以指定一个检查可用磁盘空间的时间。
create=mfsrr:low[:second] 选一个空间大于low的branch，如果空间小于low了，那么aufs会使用 round-robin 方式。
更多的关于AUFS的细节使用参数，大家可以直接在Ubuntu 14.04下通过 man aufs 来看一下其中的各种参数和命令。
AUFS的性能
AUFS的性能慢吗？也慢也不慢。因为AUFS会把所有的分支mount起来，所以，在查找文件上是比较慢了。因为它要遍历所有的branch。是个O(n)的算法（很明显，这个算法有很大的改进空间的）所以，branch越多，查找文件的性能也就越慢。但是，一旦AUFS找到了这个文件的inode，那后以后的读写和操作原文件基本上是一样的。
所以，如果你的程序跑在在AUFS下，open和stat操作会有明显的性能下降，branch越多，性能越差，但是在write/read操作上，性能没有什么变化。
IBM的研究中心对Docker的性能给了一份非常不错的性能报告（PDF）《An Updated Performance Comparison of Virtual Machinesand Linux Containers》
我截了两张图出来，第一张是顺序读写，第二张是随机读写。基本没有什么性能损失的问题。而KVM在随机读写的情况也就有点慢了（但是，如果硬盘是SSD的呢？）
原文出自：coolshell
（转载文章请注明作者和出处 酷 壳 – CoolShell ，请勿用于任何商业用途）

	`$GOOS`	`$GOARCH`
	`darwin`	`386`
	`darwin`	`amd64`
	`darwin`	`arm`
	`darwin`	`arm64`
	`dragonfly`	`amd64`
	`freebsd`	`386`
	`freebsd`	`amd64`
	`freebsd`	`arm`
	`linux`	`386`
	`linux`	`amd64`
	`linux`	`arm`
	`linux`	`arm64`
	`linux`	`ppc64`
	`linux`	`ppc64le`
	`netbsd`	`386`
	`netbsd`	`amd64`
	`netbsd`	`arm`
	`openbsd`	`386`
	`openbsd`	`amd64`
	`openbsd`	`arm`
	`plan9`	`386`
	`plan9`	`amd64`
	`solaris`	`amd64`
	`windows`	`386`
	`windows`	`amd64`